TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025116398
公報種別
公開特許公報(A)
公開日
2025-08-08
出願番号
2024010798
出願日
2024-01-29
発明の名称
生成方法、探索方法、および生成装置
出願人
キオクシア株式会社
代理人
弁理士法人酒井国際特許事務所
主分類
G06F
16/903 20190101AFI20250801BHJP(計算;計数)
要約
【課題】メモリ使用量が少ない探索動作を可能にするインデックス情報の生成方法、当該インデックス情報を用いた探索方法、および生成装置を提供すること。
【解決手段】生成方法は、設定することと、ライトすることと、を含む。設定することは、探索範囲に含まれる複数の第1ベクトルに対応した複数の第1ノードのうちの1つを第2ノードとして設定することである。ライトすることは、第2ベクトルと、第2ノードの出隣接ノードである1以上の第3ノードのそれぞれについてIDおよび第3ノードに対応するベクトルである第3ベクトルと、を含む情報片をライトすることである。第2ベクトルは、複数の第1ベクトルのうちの第2ノードに対応した第1ベクトルである。情報片は有向グラフに対応したインデックス情報のうちの第2ノードにかかる要素である。
【選択図】図6
特許請求の範囲
【請求項1】
有向グラフで表されるデータを処理するように構成されたプロセッサによる生成方法であって、
前記有向グラフに含まれるそれぞれIDがアサインされた複数の第1ノードであって探索範囲に含まれる複数の第1ベクトルに対応した複数の第1ノードのうちの1つを第2ノードとして設定することと、
前記複数の第1ベクトルのうちの前記第2ノードに対応した第1ベクトルである第2ベクトルと、前記複数の第1ノードのうちの前記第2ノードの全ての出隣接ノードである1以上の第3ノードのそれぞれについてIDおよび第3ベクトルと、を含む情報片をライトすることと、前記第3ベクトルは前記第3ノードに対応するベクトルであり、前記情報片は前記有向グラフに対応したインデックス情報のうちの前記第2ノードにかかる要素である、
を含む生成方法。
続きを表示(約 1,900 文字)
【請求項2】
前記第3ベクトルは、前記第3ノードに対応する第1ベクトル、又は前記第3ノードに対応する前記第1ベクトルを圧縮することで生成されるベクトルである、
請求項1に記載の生成方法。
【請求項3】
複数回の第1動作を実行することをさらに含み、前記複数回の第1動作のそれぞれは、前記設定すること、および前記ライトすることを含み、
前記複数回の第1動作のそれぞれにおいて、前記設定することは、前記複数の第1ノードのうちのまだ前記第2ノードとして設定されていない第1ノードを設定し、
前記複数回の第1動作は、前記第2ノードとして設定されていない第1ノードがなくなるまで実行される、
請求項1に記載の生成方法。
【請求項4】
前記ライトすることは、前記第2ノードの出隣接ノードの数を前記情報片に追加することを含む、
請求項1に記載の生成方法。
【請求項5】
複数回の第1動作を実行することをさらに含み、前記複数回の第1動作のそれぞれは、前記設定すること、および前記ライトすることを含み、
前記複数回の第1動作のそれぞれにおける前記ライトすることは、複数の第1記憶領域のうちのそれぞれ異なる第1記憶領域に前記情報片をライトすることであり、
前記複数の第1記憶領域のそれぞれはストレージデバイスへのアクセスの単位に対応する、
請求項1から請求項4の何れか一項に記載の生成方法。
【請求項6】
クエリを取得することと、
インデックス情報によって規定された有向グラフに沿って前記クエリに最も近い第1ノードの候補を設定することと、前記有向グラフは探索範囲である複数の第1ベクトルに対応した複数の第1ノードを含み、前記インデックス情報がストレージデバイスに格納され、前記インデックス情報は複数の第1情報片を含み、前記複数の第1情報片のそれぞれは前記複数の第1ベクトルのうちの1つの第1ノードに対応する第1ベクトルである第2ベクトルと前記複数の第1ノードのうちの前記1つの第1ノードの全ての出隣接ノードである1以上の第2ノードのそれぞれについてIDおよび第3ベクトルを含み、前記第3ベクトルは前記第2ノードに対応するベクトルであり、
を含み、
前記候補を設定することは、前記候補の第1ノードである第3ノードにかかる第1情報片である第2情報片を前記ストレージデバイスへのアクセスの単位に対応する第1の記憶領域からリードして、リードされた前記第2情報片を前記ストレージデバイスよりもアクセスの動作が高速なメモリに格納することと、
前記メモリに格納された前記第2情報片に含まれる1以上の前記第3ベクトルに基づいて新たな候補の第1ノードを設定することと、
を含む探索方法。
【請求項7】
前記第3ベクトルは、前記第2ノードに対応する第1ベクトル、又は前記第2ノードに対応する前記第1ベクトルを圧縮することで生成されるベクトルである、
請求項6に記載の探索方法。
【請求項8】
前記メモリに前記第2情報片が格納された後、格納された前記第2情報片に含まれる第1ベクトルを用いて前記候補の第1ノードと前記クエリとの距離を計算することと、
前記候補として設定されたことがある複数の第1ノードのそれぞれと前記クエリとの複数の前記距離に基づいて前記クエリに最も近いベクトルを特定することと、
をさらに含む請求項6に記載の探索方法。
【請求項9】
それぞれIDがアサインされた複数の第1ノードを含む有向グラフおよび探索範囲に含まれる複数の第1ベクトルを受信するように構成されたインタフェース回路と、前記複数の第1ノードは前記複数の第1ベクトルに対応し、
前記複数の第1ノードのうちの1つを第2ノードとして設定することと、
前記複数の第1ベクトルのうちの前記第2ノードに対応した第1ベクトルである第2ベクトルと、前記複数の第1ノードのうちの前記第2ノードの全ての出隣接ノードである1以上の第3ノードのそれぞれについてIDおよび第3ベクトルと、を含む情報片をライトすることと、前記第3ベクトルは前記第3ノードに対応するベクトルであり、前記情報片は前記有向グラフに対応したインデックス情報のうちの前記第2ノードにかかる要素である、
を実行するように構成されたプロセッサと、
を備える生成装置。
発明の詳細な説明
【技術分野】
【0001】
本実施形態は、生成方法、探索方法、および生成装置に関する。
続きを表示(約 2,200 文字)
【背景技術】
【0002】
グラフベースの近似最近傍探索アルゴリズムの一つとして、DiskANN(Disk-based Approximate Nearest Neighbor search)というアルゴリズムが知られている。DiskANNによれば、探索の範囲である多次元ベクトル群のうちのそれぞれの多次元ベクトルをノードと見なして有向グラフが作成され、この有向グラフの構造に基づいて生成されたインデックス情報がストレージデバイスに格納される。そして、ストレージデバイス内の当該インデックス情報に基づき、有向グラフに沿った探索動作が行われる。
【先行技術文献】
【非特許文献】
【0003】
Suhas Jayaram Subramanya, Devvrit, Rohan Kadekodi, Ravishankar Krishaswamy, and Harsha Vardhan Simhadri, “DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node”, [online], November 2019, NeurIPS, [retrieved on 2022-12-11], retrieved from the Internet: <URL: https://suhasjs.github.io/files/diskann_neurips19.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0004】
一つの実施形態は、メモリ使用量が少ない探索動作を可能にするインデックス情報の生成方法、当該インデックス情報を用いた探索方法、および生成装置を提供することを目的とする。
【課題を解決するための手段】
【0005】
一つの実施形態によれば、生成方法は、有向グラフで表されるデータを処理するように構成されたプロセッサによる生成方法である。生成方法は、設定することと、ライトすることと、を含む。設定することは、探索範囲に含まれる複数の第1ベクトルに対応した複数の第1ノードのうちの1つを第2ノードとして設定することである。複数の第1ノードは、有向グラフに含まれるそれぞれIDがアサインされた複数のノードである。ライトすることは、第2ベクトルと、1以上の第3ノードのそれぞれについてIDおよび第3ノードに対応するベクトルである第3ベクトルと、を含む情報片をライトすることである。第2ベクトルは、複数の第1ベクトルのうちの第2ノードに対応した第1ベクトルである。1以上の第3ノードは、複数の第1ノードのうちの第2ノードの全ての出隣接ノードである。情報片は有向グラフに対応したインデックス情報のうちの第2ノードにかかる要素である。
【図面の簡単な説明】
【0006】
実施形態の探索装置の構成の一例を示す模式的な図。
実施形態にかかる有向グラフおよびインデックス情報の構成を説明するための図。
実施形態の探索装置が探索を実行する際にSSDおよびDRAMに格納されている情報の一例を説明するための模式的な図。
実施形態の生成装置の構成の一例を示す模式的な図。
実施形態の生成装置が備えるプロセッサが実現する機能の一例を示す模式的な図。
実施形態の生成装置の動作の一例を示すフローチャート。
実施形態の探索装置が備えるプロセッサが実現する機能の一例を示す模式的な図。
実施形態の探索装置の動作の一例を示すフローチャート。
変形例1にかかるノード情報の構成の一例を示す図。
変形例2にかかるノード情報の構成の一例を示す図。
【発明を実施するための形態】
【0007】
以下に添付図面を参照して、実施形態にかかる生成方法、探索方法、および生成装置を詳細に説明する。なお、これらの実施形態により本発明が限定されるものではない。
【0008】
(実施形態)
まず、実施形態の探索方法が実行される装置(探索装置と表記する)の例を説明する。図1は、実施形態の探索装置の構成の一例を示す模式的な図である。
【0009】
図1に示す例では、探索装置2は、プロセッサ21、インタフェース22、SSD(Solid State Drive)23、DRAM(Dynamic Random Access Memory)24、およびバス25を備える。プロセッサ21、インタフェース22、SSD23、およびDRAM24は、バス25に電気的に接続される。
【0010】
インタフェース22は、探索装置2に対して情報を入出力するための装置である。インタフェース22は、ネットワークを介した通信のためのインタフェース、記憶装置が接続され得るインタフェース、キーボードなどの入力装置が接続され得るインタフェース、などを含む。探索装置2は、インタフェースを介してクエリの入力を受け付けることができる。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
キオクシア株式会社
磁気メモリ
19日前
キオクシア株式会社
半導体記憶装置
7日前
キオクシア株式会社
メモリシステム
7日前
キオクシア株式会社
半導体記憶装置
11日前
キオクシア株式会社
メモリシステム
13日前
キオクシア株式会社
半導体記憶装置
14日前
キオクシア株式会社
半導体記憶装置
18日前
キオクシア株式会社
キャッシュサーバ
15日前
キオクシア株式会社
レジスト製造方法
21日前
キオクシア株式会社
半導体装置及びその製造方法
19日前
キオクシア株式会社
半導体装置およびその製造方法
20日前
キオクシア株式会社
情報処理システム、およびホスト
5日前
キオクシア株式会社
半導体製造装置およびその制御方法
20日前
キオクシア株式会社
メモリシステム、メモリコントローラ、およびデータ読み出し方法
14日前
個人
裁判のAI化
2か月前
個人
フラワーコートA
1か月前
個人
情報処理システム
2か月前
個人
工程設計支援装置
1か月前
個人
検査システム
2か月前
個人
介護情報提供システム
1か月前
個人
為替ポイント伊達夢貯
12日前
個人
冷凍食品輸出支援構造
12日前
個人
設計支援システム
1か月前
個人
携帯情報端末装置
1か月前
個人
設計支援システム
1か月前
個人
表変換編集支援システム
5日前
株式会社サタケ
籾摺・調製設備
2か月前
個人
知財出願支援AIシステム
12日前
キヤノン電子株式会社
携帯装置
2か月前
個人
結婚相手紹介支援システム
29日前
株式会社カクシン
支援装置
1か月前
個人
AIによる情報の売買の仲介
14日前
個人
パスワード管理支援システム
5日前
個人
行動時間管理システム
7日前
個人
AIキャラクター制御システム
5日前
個人
アンケート支援システム
1か月前
続きを見る
他の特許を見る