ニュース
2020.08.26
プレスリリース
Gunosyの研究論文が推薦システムに関する国際会議「RecSys」にて2年連続で採択
株式会社Gunosy(本社:東京都港区、代表取締役社長:竹谷祐哉、以下、Gunosy)と理化学研究所(本部:埼玉県和光市、理事長:松本紘、以下、理研)は、Gunosy内の「Gunosy Tech Lab(読み:グノシー テック ラボ、以下、同ラボ)」にて、「データセット公開のためにKPIを匿名化する方法」(原題:A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets)の研究結果を発表した論文が、推薦システムに関する国際会議 The ACM Conference Series on Recommender Systems (RecSys 2020) にLong Paperとして採択されたことをお知らせいたします。
RecSysは、推薦システムにおいて最も権威ある国際会議と言われており、Gunosyとして昨年に続いて2年連続の採択となりました。第14回目となる2020年の会議はブラジルのリオデジャネイロで2020年9月22日から26日まで開催予定でしたが、新型コロナウイルスの影響を受け、同期間にオンラインで開催される予定です。
■研究背景
Gunosyでは「情報を世界中の⼈に最適に届ける」というビジョンのもと、最適に情報を届けられるよう、ユーザーの趣向にあう情報を届けるための推薦システムを日々改善しています。本研究はデータセット(※1)の公開においてビジネスKPI(※2)の漏洩を防ぐための方法を研究したものです。近年の人工知能研究においてデータセットは非常に重要であり、推薦システムもその例外ではありません。良い推薦システムを開発するためには、世の中の良い研究成果を取り入れていくことが重要ですが、データセットを公開することでそのプロセスをより強固にすることが期待できます。しかしデータセットの公開は様々な事業リスクがあるため容易ではありません。今回我々はデータセット公開におけるリスク、特にビジネスKPIの漏洩に着目し、それを匿名化して公開する方法を開発しました。データセットの公開をどのようにすべきかの方法論の研究は今までなく、今回、世界でも初めてその手法に関する研究をし、論文として発表したものとなります。
(※1)データの集合。機械学習モデル・推薦システムなどを開発するためには学習・評価のためにデータが必要であり、今回は推薦システムの学習・評価用データを意味する。
(※2)Key Performance Indicatorの略。目標達成のために行った行動を評価するための指標のこと。
■論文概要
本研究は同ラボの上席研究員である関 喜史と理化学研究所理研革新知能統合研究センター 離散最適化ユニットの前原 貴憲ユニットリーダーが共同で行いました。
今回採択された論文「A Method to Anonymize Business Metrics to Publishing Implicit Feedback Datasets」では、「グノシー」のユーザー行動ログを用いて、企業が持つデータセット公開手法のリスクを洗い出し、それを防ぐ方法を定式化することで、安全にデータセットを公開する方法を提案しています。
データ公開における課題として、本研究ではビジネスKPIの漏洩、公平性、人気バイアスの3つの課題を挙げ、それを解決しながら公開用データセットを構築する手法として、データセット内におけるビジネスKPI、ユーザー属性、アイテム属性の3つの分布が任意の分布になるようにサンプリング確率を決定する最適化問題を解くことを提案しました。最適化問題から決定されたサンプリング確率に従って、元データからサンプリングするユーザーを決定し、公開用データセットを構築することで、3つの課題に対応した安全な公開用データセットが構築できることを確認しています。
手法の実装と本研究によって作成されたデータセットは公開されており、研究に利用することができます。Gunosyはこのデータセットを用いてより再現性の高い研究の実施に取り組んで参ります。また、国内外問わず、推薦システムの研究がさらに活発になることを期待し、今後も推薦システムに関する研究と改善を行い、よりよいサービス提供を行っていけるよう開発を進めて参ります。
■Gunosy 会社概要
Gunosyは「情報を世界中の人に最適に届ける」を企業理念に掲げ、情報キュレーションアプリ「グノシー」、KDDI株式会社と共同で提供する、ニュース配信アプリ「ニュースパス」、女性向け総合情報アプリ「LUCRA(ルクラ)」等のメディアの開発・運営をしています。また、これらのメディアを通じたメディア事業のほか、「Gunosy Ads」や「Gunosy Ad Network」等のアドテク事業も行っています。
会社名:株式会社Gunosy
所在地:東京都港区赤坂 1-12-32 アーク森ビル
企業理念:「情報を世界中の人に最適に届ける」
事業内容:情報キュレーションサービスその他メディア開発及び運営
提供サービス:グノシー、ニュースパス、LUCRA(ルクラ)、グノシースポーツ、オトクル
■理研について
理化学研究所(りかがくけんきゅうしょ、英語名:RIKEN)は、日本で唯一の自然科学の総合研究所として、物理学、工学、化学、数理・情報科学、計算科学、生物学、医科学などに及ぶ広い分野で研究を進めています。1917年(大正6年)の創設以降、研究成果を社会に普及させるため、大学や企業との連携による共同研究、受託研究等を実施しているほか、知的財産等の産業界への技術移転を積極的に進めています。