LG AI研究院、初の商用化サービス「キャプショニングAI」学会で公開

[写真=LG]


 
LG AI研究院がカナダ·バンクーバーで開かれている世界最大のコンピュータービジョン学会に参加した。
 
LG AI研究院は18日(現地時間)、「CVPR 2023」でイメージ検索市場に変化をもたらす「キャプショニング人工知能(AI)」を外部に初めて公開したと19日、明らかにした。 
 
これは生成型AI商用化サービスで、人間のように初めて見るイメージまで自然言語で説明できる。 画像検索に活用できる情報である文章やキーワードなどメタデータを作る。
 
AIが人間のように初めて見る物体や場面に対しても以前の経験と知識を活用して理解し、説明できるように「ゼロショットイメージキャプショニング」技術を適用したというのが研究院側の説明だ。
 
既存に学習した大量イメージとテキストデータに基づいてイメージ上の多様な要素と特徴を認識し、その関係を理解して説明できるようにする。 
 
キャプショニングAIは大量のイメージを管理しなければならない企業の業務効率性と生産性を高めることができる。 文章や単語の長さと個数によって異なるが、平均的に5つの文章と10つのキーワードを10秒以内に生成する。 イメージ範囲を1万枚に拡張すれば、2日以内に作業を終えることができ、早い時間内にオーダーメード型イメージ検索·管理システム構築が可能だ。
 
今回の結果はLG AI研究院とShutterstock間の緊密な協力があって可能だった。 Shutterstockは視覚コンテンツが毎日数十万個以上新しく追加される世界最大のプラットフォーム企業で、コンテンツを分析し処理する経験が豊富な専門家が布陣している。 Shutterstockとデータ学習からサービス開発まで共にし、完成度を高めた。
 
さらに、LG AI研究院はゼロショットイメージキャプショニングをテーマに、ソウル大学・AI大学院、Shutterstockと共にワークショップを行った。 上半期に行われたLGグローバルAIチャレンジ授賞式も開かれた。
亜洲日報の記事等を無断で複製、公衆送信 、翻案、配布することは禁じられています。
기사 이미지 확대 보기
경북 포항시 경북 포항시
닫기