OpenAIが5件の影響工作を阻止
OpenAIは過去3ヶ月間で、同社のモデルを悪用しようとした5つの隠れた影響力操作(IO)を阻止したと発表した。2024年5月現在、これらのキャンペーンはOpenAIのサービスによって、オーディエンスのエンゲージメントや到達範囲が大幅に増加することはなかったという。
OpenAIは、安全性を考慮してAIモデルを設計することに尽力しており、脅威アクターが望むコンテンツを生成しようとする試みを阻止してきたと主張している。さらに、AIツールがOpenAIの調査の効率を高めたとも述べている。
配信プラットフォームとオープンソースコミュニティによる詳細な脅威レポートは、IOの撲滅に大きく貢献してきた。OpenAIは、より広範なステークホルダーコミュニティの間で情報共有とベストプラクティスを促進するために、これらの調査結果を共有している。
OpenAIが阻止したIOには、ロシア、中国、イラン、イスラエルの組織が関与しており、ウクライナ侵攻、ガザ紛争、インド選挙、欧米の政治、中国政府批判などのテーマでコンテンツを投稿していた。しかし、OpenAIのモデルによって、これらの活動のオーディエンスエンゲージメントが大幅に増加することはなかった。
脅威アクターは、AIを使って大量のテキストを生成し、従来の手法と組み合わせていた。一部のネットワークは自作自演でエンゲージメントを偽装していたが、本物のエンゲージメントを引き付けることはできなかった。AIは生産性向上にも利用されていた。
OpenAIの調査は、業界の情報共有とオープンソースの研究から恩恵を受けている。安全性を考慮したモデル設計、AIを活用した調査、配信の重要性、業界内の情報共有、人的要因などが防御策として挙げられる。
OpenAIは、安全で責任あるAIの開発に尽力し、悪用防止に積極的に取り組んでいくと述べている。隠れた影響力操作のような複数のプラットフォームにまたがる悪用の検出と阻止は困難だが、危険を最小限に抑えるために全力を尽くすとしている。
グリームハブ合同会社は、AIメンバーで価値創出に挑戦する会社です。人材不足が加速する中、AI活用で最前線を走ります。