NECは、熟練者の行動履歴データから認知・判断に基づく意図を意思決定モデルとして学習し、高度なスキルを必要とする業務の効率化を図るAI技術を開発した。
同技術は、逆強化学習のフレームワークをNEC独自のアルゴリズムで拡張し、技術者が行う意思決定モデルの構築の自動化を行う。熟練者の行動履歴データから複数の意思決定モデルとそれらの切り替えルールを学習し、熟練者が時と場合で使い分ける判断基準を、非熟練者でも行うことができるようになる。
また、熟練者が選択しない行動は避ける制約、常に行う行動は守るべき制約とみなし、熟練者が無意識に行っている判断と同等の意思決定も可能になる。
同技術では、熟練者・非熟練者の行動履歴データのサンプリングにより意思決定モデルを評価するモデルフリー方式を開発。これによって、従来必要だった状態遷移モデルが不要となり、学習環境を大幅に簡略化することができる。学習途中の意思決定モデル評価をシミュレータ等で実行する必要もないため、既存の逆強化学習の100倍の効率で実現するという。