TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025091801
公報種別公開特許公報(A)
公開日2025-06-19
出願番号2023207264
出願日2023-12-07
発明の名称圧縮プログラム、圧縮方法および圧縮装置
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G16C 20/00 20190101AFI20250612BHJP(特定の用途分野に特に適合した情報通信技術)
要約【課題】類似検索を行う場合の読み出し速度を向上させること。
【解決手段】圧縮装置は、符号化されたアミノ酸配列で表現されたタンパク質の情報を取得する。圧縮装置は、タンパク質の情報の圧縮率の条件または圧縮したタンパク質の情報を展開する際に要する時間の条件と、可逆圧縮関数との関係を定義した圧縮ポリシーを基にして、タンパク質の情報を圧縮する。圧縮装置は、圧縮したタンパク質の情報を記憶装置に登録する。圧縮装置は、記憶装置に対するアクセスを受け付けた場合に、記憶装置に登録された圧縮されたタンパク質の情報を展開する。
【選択図】図2
特許請求の範囲【請求項1】
符号化されたアミノ酸配列で表現されたタンパク質の情報を取得し、
前記タンパク質の情報の圧縮率の条件または圧縮した前記タンパク質の情報を展開する際に要する時間の条件と、可逆圧縮関数との関係を定義した圧縮ポリシーを基にして、前記タンパク質の情報を圧縮し、
圧縮した前記タンパク質の情報を記憶装置に登録し、
前記記憶装置に対するアクセスを受け付けた場合に、前記記憶装置に登録された圧縮されたタンパク質の情報を展開する
処理をコンピュータに実行させることを特徴とする圧縮プログラム。
続きを表示(約 1,000 文字)【請求項2】
前記圧縮ポリシーは、前記圧縮率の異なる複数の可逆圧縮関数を定義し、前記タンパク質の情報を圧縮する処理は、前記タンパク質の情報を圧縮する際の圧縮率が最大となる可逆圧縮関数を選択し、選択した可逆圧縮関数を基にして、前記タンパク質の情報を圧縮することを特徴とする請求項1に記載の圧縮プログラム。
【請求項3】
前記圧縮ポリシーは、前記圧縮率が閾値以上である場合にDelfate圧縮を実行し、前記圧縮率が前記閾値未満である場合に恒等写像を実行することが定義され、前記圧縮する処理は、前記Delfate圧縮または前記恒等写像を選択して、前記タンパク質の情報を圧縮することを特徴とする請求項2に記載の圧縮プログラム。
【請求項4】
前記圧縮ポリシーは、圧縮した前記タンパク質の情報を展開する際に要する時間の異なる複数の可逆圧縮関数を定義し、前記タンパク質の情報を圧縮する処理は、前記圧縮した前記タンパク質の情報を展開する際に要する時間が最小となる可逆圧縮関数を選択し、選択した可逆圧縮関数を基にして、前記タンパク質の情報を圧縮することを特徴とする請求項1に記載の圧縮プログラム。
【請求項5】
符号化されたアミノ酸配列で表現されたタンパク質の情報を取得し、
前記タンパク質の情報の圧縮率の条件または圧縮した前記タンパク質の情報を展開する際に要する時間の条件と、可逆圧縮関数との関係を定義した圧縮ポリシーを基にして、前記タンパク質の情報を圧縮し、
圧縮した前記タンパク質の情報を記憶装置に登録し、
前記記憶装置に対するアクセスを受け付けた場合に、前記記憶装置に登録された圧縮されたタンパク質の情報を展開する
処理をコンピュータが実行することを特徴とする圧縮方法。
【請求項6】
符号化されたアミノ酸配列で表現されたタンパク質の情報を取得し、
前記タンパク質の情報の圧縮率の条件または圧縮した前記タンパク質の情報を展開する際に要する時間の条件と、可逆圧縮関数との関係を定義した圧縮ポリシーを基にして、前記タンパク質の情報を圧縮し、
圧縮した前記タンパク質の情報を記憶装置に登録し、
前記記憶装置に対するアクセスを受け付けた場合に、前記記憶装置に登録された圧縮されたタンパク質の情報を展開する
処理を実行する制御部を有する圧縮装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、圧縮プログラム等に関する。
続きを表示(約 1,200 文字)【背景技術】
【0002】
高分子化合物の一種であるタンパク質は20種類のアミノ酸により鎖状に構成される。たとえば、タンパク質のアミノ酸配列を符号列で記述する形式として、FASTA形式が知られている。以下の説明では、適宜、FASTA形式のタンパク質のデータを「FASTAデータ」と表記する。
【0003】
図14は、FASTAデータの一例を示す図である。たとえば、alanine(“A”)、aspartate(“B”)、cystine(“C”)の3つのアミノ酸から構成されるタンパク質「PROTEIN A」は、FASTAデータ5で表現される。
【0004】
たとえば、FASTAデータを格納するタンパク質データベースから入力配列の類似検索を行う技術として、HMMER、HH-suite3等がある。図15は、従来技術の類似検索の一例を説明するための図である。図15に示す例では、タンパク質データベース6に、タンパク質「PROTEIN A」、「PROTEIN B」、「PROTEIN C」のFASTAデータが格納されている。
【0005】
タンパク質「PROTEIN A」のアミノ酸配列を「ABC」とする。タンパク質「PROTEIN B」のアミノ酸配列を「DEF」とする。タンパク質「PROTEIN C」のアミノ酸配列を「GHI」とする。
【0006】
たとえば、入力配列7として「AAA」が指定されると、アミノ酸配列の1番目の符号が一致する、タンパク質「PROTEIN A」が検索される。
【0007】
なお、実際のタンパク質データベース6は、BFD(Big Fantastic Database)等であり、25億件のタンパク質のFASTAデータが格納される。BFDは、全て非圧縮の状態でFASTAデータを格納しており、データサイズは、1.7TiBである。
【先行技術文献】
【特許文献】
【0008】
米国特許出願公開第2020/0294629号明細書
特開2007-193708号公報
特開2004-240975号公報
米国特許出願公開第2016/0306919号明細書
【発明の概要】
【発明が解決しようとする課題】
【0009】
上記のBFDのような巨大なタンパク質データベースは、大容量だが低速なネットワークファイルシステム等に格納されるため、類似検索を行う場合に、読み出し速度が低下する。このため、類似検索を行う場合の読み出し速度を向上させることについて、改善の余地がある。
【0010】
1つの側面では、本発明は、類似検索を行う場合の読み出し速度を向上させることができる圧縮プログラム、圧縮方法および圧縮装置を提供することを目的とする。
【課題を解決するための手段】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
測定装置
3日前
富士通株式会社
光伝送装置
24日前
富士通株式会社
画像変換機器と方法
6日前
富士通株式会社
量子デバイス上の誤り訂正
1か月前
富士通株式会社
光伝送装置および光伝送方法
11日前
富士通株式会社
光受信装置及び光伝送システム
1か月前
富士通株式会社
制御プログラム、および制御方法
12日前
富士通株式会社
人工知能ベースのサステナブル材料設計
1か月前
富士通株式会社
管理装置、管理方法および管理プログラム
17日前
富士通株式会社
通信管理装置および無線リソース予測方法
13日前
富士通株式会社
圧縮プログラム、圧縮方法および圧縮装置
3日前
富士通株式会社
ホモグラフィの取得装置、方法及び電子機器
18日前
富士通株式会社
因果関係分析方法及び因果関係分析プログラム
26日前
富士通株式会社
プログラム、データ処理方法およびデータ処理装置
1か月前
富士通株式会社
メモリ駆動装置、光伝送システム、及びメモリ駆動方法
1か月前
富士通株式会社
レース投票券購入方法及びレース投票券購入プログラム
12日前
富士通株式会社
ログ管理装置、ログ管理方法およびログ管理プログラム
1か月前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
1か月前
富士通株式会社
強化学習プログラム、強化学習方法および情報処理装置
25日前
富士通株式会社
画像に基づいて視程値を計算する装置、方法及び電子機器
18日前
富士通株式会社
分散シフト・ファイバーに関する前方ラマン・ポンピング
1か月前
富士通株式会社
量子コンピューティング・システム・モデルのトレーニング
1か月前
富士通株式会社
出力制御プログラム、出力制御方法およびナビゲーション装置
10日前
富士通株式会社
光伝送路監視装置、光伝送路監視方法、および光伝送システム
1か月前
富士通株式会社
リソース管理装置、リソース管理方法およびリソース管理プログラム
23日前
富士通株式会社
対象認識装置、対象認識方法及びコンピュータ読み取り可能な記憶媒体
1か月前
富士通株式会社
量子回路情報生成プログラム、量子回路情報生成方法、および情報処理装置
16日前
富士通株式会社
機械学習プログラム、機械学習方法、推論プログラム、推論方法及び情報処理装置
3日前
富士通株式会社
交通シミュレーションの進化を予測するための、コンピュータにより実施される方法
5日前
富士通株式会社
多変量データを予測するようニューラルネットワークをトレーニングする方法およびシステム
18日前
個人
支援システム
1か月前
個人
管理装置
20日前
個人
対話システム
20日前
個人
情報システムおよび方法
2か月前
株式会社タカゾノ
薬剤秤量装置
11日前
エムスリー株式会社
媒体
4か月前
続きを見る