この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので十分ご注意ください。
AWSベースの書き起こしサービスのAmazon Transcribeが米国時間2月27日の午前、小さいながら重要な新機能をローンチした。その実装が正しければ、通話記録の書き起こしから個人情報を自動的に隠すことができる。
Amazon Transcribeの最も一般的なユースケースは、顧客からの電話を書き起こすことだ。ほとんどの場合、通話中に名前や住所、クレジットカードの番号などの情報が伝えらえれる。私の経験では、コールセンターの中にはクレジットカード番号を伝えようとすると録音を停止するところもあるが、必ずしもそうとは限らない。
この新機能では、Amazon Transcribeは自動的に社会保障番号、クレジットカード番号、銀行口座番号、名前、メールアドレス、電話番号、郵送先住所などの情報を識別し、それを編集できる。実際には、これらの情報は「PII」という文字列に自動的に置き換えられる。
もちろん、既存のドキュメントからPIIの文字を取り除くツールも存在する。しかし多くの場合、それらはデータ損失防止ツールに力を入れており、外部の人とドキュメントを共有する時に、データが外部に漏れないことを目的としている。新しいAmazon Transcribeツールでは、少なくとも一部のデータは共有できない(もちろん、録音した音声のコピーを保管しない限り)。
現在、Amazon Transcribeは31言語をサポートしている。そのうちの6言語は、キャプションやその他のユースケースのために、リアルタイムで書き換えることができる。