パナソニック

音声認識技術を活用した文字起こしサービスで放送業界の働き方改革を支援へ

梶井統括部長

ＰＣ上で簡単に文字起こしの作業ができるようになる

映像と音声と文字起こし結果を
同時に確認しながら修正ができる

　パナソニックは１３日、音声認識技術を活用した文字起こしサービスのベータ版の提供を始めた。これまで放送業界で培ってきた技術などを生かしたもので、報道現場をはじめとした放送業界の働き方改革を支援する仕組みとして訴求していく。パナソニック　システムソリューションズ　ジャパン・パブリックシステム事業本部システム開発本部・梶井孝洋統括部長は「文字起こしにかけるコストと時間を削減し、業務プロセスを効率化できるようになる」と話す。１１月をメドに製品化する計画だ。

　提供を始めた文字起こしサービス「Ｐ―ＶｏＴ（ピーボット）」は、ディープニューラルネットワーク技術などのＡＩ（人工知能）を使った高精度な音声認識によって、現行の書き起こし制作を支援する。

　サービスは特別な機器の導入を必要とせず、インターネットブラウザ上で利用できる。「様々な業界の文字起こしに対応しているが、特に放送向け辞書が充実している」（梶井統括部長）という。

　現場担当者が収録音声をピーボットのサイトにアップロードすれば、クラウド上で自動文字起こしを行う。処理後の編集画面では映像と音声が連動して文字起こし結果を表示するため、すぐに修正ができることも特徴。再生中は音声認識結果にマーキングがつき、発声位置を探し出す作業も効率よく行える。

　既に放送キー局と関西の準キー局１４社で実証実験を行い、「１５分弱のインタビューを５分程度で一次作業を終了できた」「素材アップロードから結果が出るまでが速い」といった声が上がったという。平均して素材の２倍の速度で文字起こしできるため、１時間程度の素材なら３０分で文字起こしができる。

　サービスは収録音声を現場からアップロードし事務所で即修正するケースや長時間素材をチームで分担するケース、大量の素材をまとめて文字起こしするケースなど幅広く利用ができるため、まずは無料のベータ版を提供し反応を見ていく。

　梶井統括部長は「１１月にはサービス化したい。価格はベータ版ユーザーからの声をフィードバックし８月頃までに決める」という。価格体系は文字起こし時間に対し課金するメニューなどを検討していく。

　パナソニックでは少子高齢化に伴う労働人口の減少が進んできている背景から、過去の技術を生かし放送局向けの業務プロセスの変革に取り組んできた。

　これまでスタジオ運用を少人数化するコントローラや生字幕制作システム、ファイルベースシステムの展開を図っている。現在は取材・編集からニュース送出、配信まで総合的支援をしている。ピーボットは取材・編集領域を支援するサービスとして提案していく。

　ドライバーが苦手とする駐車操作の大部分をシステムが行うことで、ドライバーは周辺の安全確認に集中できる。同規格の発行により、一定の性能を持つシステムを搭載する車両が世界に普及し、駐車場内での自動車による交通事故の減少につながると期待される。また、国連ＳＤＧｓ（持続可能な開発目標）の一つである、２０年までの世界道路交通事故の死傷者半減への寄与も期待される。