TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2023147968
公報種別公開特許公報(A)
公開日2023-10-13
出願番号2022055780
出願日2022-03-30
発明の名称文字列変換プログラム及び文字列変換方法、並びに情報処理装置
出願人富士通株式会社
代理人個人
主分類G06F 40/129 20200101AFI20231005BHJP(計算;計数)
要約【課題】漢字及び平仮名を含まない文字列を精度よく仮名漢字文に変換する。
【解決手段】文字列分類部は、処理対象の文字列を、変換前文字列(図9(a)の矢印A,B参照)と変換済文字列とのいずれかに分類し、処理対象の文字列が変換済文字列に分類された場合には、頻度更新部が、処理対象の文字列に含まれる単語の情報で頻度DB44を更新する。また、処理対象の文字列が変換前文字列に分類された場合には、文字列変換部は、頻度DBを参照して、処理対象の文字列に含まれる単語を仮名漢字文(図9(b)の矢印A’、B’参照)に変換する。
【選択図】図9

特許請求の範囲【請求項1】
処理対象の文字列を、漢字及び平仮名を含まない第一の文字列と、前記第一の文字列以外の第二の文字列と、のいずれかに分類し、
前記処理対象の文字列が前記第二の文字列に分類された場合に、単語の使用状況を記憶する記憶部を、前記処理対象の文字列に含まれる単語の情報で更新し、
前記処理対象の文字列が前記第一の文字列に分類された場合に、前記記憶部を参照して、前記使用状況に基づいて、前記処理対象の文字列に含まれる単語を変換する、
処理をコンピュータに実行させることを特徴とする文字列変換プログラム。
続きを表示(約 980 文字)【請求項2】
前記処理対象の文字列を入力したユーザ又は組織が前記処理対象の文字列を入力する前に漢字または平仮名を含む文字列を入力していた場合には、前記処理対象の文字列が漢字及び平仮名を含まない場合でも、前記分類する処理において前記処理対象の文字列を前記第二の文字列に分類する、ことを特徴とする請求項1に記載の文字列変換プログラム。
【請求項3】
前記更新する処理及び前記変換する処理において用いる前記記憶部は、前記処理対象の文字列を入力したユーザ又は組織に対応する記憶部である、ことを特徴とする請求項1又は2に記載の文字列変換プログラム。
【請求項4】
前記変換する処理では、カタカナから漢字に変換する変換候補を格納する変換候補格納部を参照して、前記処理対象の文字列に含まれる単語の変換候補を複数特定し、複数の前記変換候補それぞれの前記使用状況に基づいて、前記処理対象の文字列に含まれる単語を変換する、ことを特徴とする請求項1又は2に記載の文字列変換プログラム。
【請求項5】
処理対象の文字列を、漢字及び平仮名を含まない第一の文字列と、前記第一の文字列以外の第二の文字列と、のいずれかに分類し、
前記処理対象の文字列が前記第二の文字列に分類された場合に、単語の使用状況を記憶する記憶部を、前記処理対象の文字列に含まれる単語の情報で更新し、
前記処理対象の文字列が前記第一の文字列に分類された場合に、前記記憶部を参照して、前記使用状況に基づいて、前記処理対象の文字列に含まれる単語を変換する、
処理をコンピュータが実行することを特徴とする文字列変換方法。
【請求項6】
処理対象の文字列を、漢字及び平仮名を含まない第一の文字列と、前記第一の文字列以外の第二の文字列と、のいずれかに分類する分類部と、
前記処理対象の文字列が前記第二の文字列に分類された場合に、単語の使用状況を記憶する記憶部を、前記処理対象の文字列に含まれる単語の情報で更新する更新部と、
前記処理対象の文字列が前記第一の文字列に分類された場合に、前記記憶部を参照して、前記使用状況に基づいて、前記処理対象の文字列に含まれる単語を変換する変換部と、
を備える情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、文字列変換プログラム及び文字列変換方法、並びに情報処理装置に関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
自治体において固定資産税などの情報を管理するシステムには、各種機能が設けられているが、例えば、入力された資産等を表す文字列が間違えて入力されていないか、入力すべき文字列が抜けていないか等を判定する機能等があると、自治体の職員等にとって便利である。このような判定機能を実現するためには、単に文字列の一致・不一致を確認するだけでは足りず、意味が似ているものをまとめ、まとめた範囲内で入力間違いや過不足があるか等を判定する必要がある。
【0003】
従来、文字列を多次元の特徴ベクトル化して抽出する技術が知られている。この技術によれば、同意語などを近いベクトルに割り当てることができるため、類似している文字列をまとめたりすることができる。
【先行技術文献】
【特許文献】
【0004】
特開平8-202706号公報
特開平8-95970号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、固定資産税などの情報を管理するシステムの中には、カタカナ文(平仮名や漢字を含まない文字列)しか入力できないシステムも存在している。カタカナ文は、意味を持つ単位に分割することが難しく、分割できたとしてもどのような意味であるかを判別するのが難しい。
【0006】
このようなカタカナ文を精度よく仮名漢字文(平仮名や漢字を含む文字列)に変換することができれば、仮名漢字文に含まれる単語に基づいた特徴などを抽出することができ、類似度を算出できると考えられる。
【0007】
1つの側面では、本発明は、漢字及び平仮名を含まない文字列を精度よく変換することが可能な文字列変換プログラム及び文字列変換方法、並びに情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
一つの態様では、文字列変換プログラムは、処理対象の文字列を、漢字及び平仮名を含まない第一の文字列と、前記第一の文字列以外の第二の文字列と、のいずれかに分類し、前記処理対象の文字列が前記第二の文字列に分類された場合に、単語の使用状況を記憶する記憶部を、前記処理対象の文字列に含まれる単語の情報で更新し、前記処理対象の文字列が前記第一の文字列に分類された場合に、前記記憶部を参照して、前記使用状況に基づいて、前記処理対象の文字列に含まれる単語を変換する、処理をコンピュータに実行させるプログラムである。
【発明の効果】
【0009】
漢字及び平仮名を含まない文字列を精度よく変換することができる。
【図面の簡単な説明】
【0010】
一実施形態に係る情報処理システムの構成を概略的に示す図である。
図1の自治体税賦課サーバのハードウェア構成を示す図である。
自治体税賦課サーバの機能ブロック図である。
図4(a)は、文字列特定部が資産情報DBから取得する情報の一例を示す図であり、図4(b)は、変換辞書の一例を示す図であり、図4(c)は、頻度DBの一例を示す図である。
出力例を示す図である。
自治体税賦課サーバの処理を示すフローチャートである。
図6のステップS16の詳細処理を示すフローチャートである。
図6のステップS22の詳細処理を示すフローチャートである。
図9(a)~図9(c)は、一実施形態の概要を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
基板連結構造
28日前
富士通株式会社
画像処理方法
13日前
富士通株式会社
光信号パワー利得
24日前
富士通株式会社
増幅装置及び増幅方法
14日前
富士通株式会社
演算装置および演算方法
18日前
富士通株式会社
演算回路及び演算処理方法
14日前
富士通株式会社
電子装置及び改竄検知方法
11日前
富士通株式会社
物体検出システム及び方法
19日前
富士通株式会社
光伝送システムでの異常の位置特定
1か月前
富士通株式会社
半導体装置及び半導体装置の製造方法
28日前
富士通株式会社
移相量調整装置、及び、移相量調整方法
21日前
富士通株式会社
情報処理方法および情報処理プログラム
13日前
富士通株式会社
情報処理プログラムおよび情報処理装置
5日前
富士通株式会社
病変検出方法および病変検出プログラム
14日前
富士通株式会社
スイッチング電源、増幅装置及び通信装置
13日前
富士通株式会社
プログラム、算出方法および情報処理装置
6日前
富士通株式会社
働きかけ表示方法、働きかけ表示プログラム
14日前
富士通株式会社
車両経路選択問題及びその変形例の経路生成
11日前
富士通株式会社
物品数量を検出する装置と方法及び電子機器
18日前
富士通株式会社
クエリ実行方法およびクエリ実行プログラム
21日前
富士通株式会社
物品数量を検出する装置と方法及び電子機器
18日前
富士通株式会社
自動化されたカスタム特徴エンジニアリング
28日前
富士通株式会社
データ処理装置、プログラム及びデータ処理方法
4日前
富士通株式会社
データ処理装置、プログラム及びデータ処理方法
17日前
富士通株式会社
データ処理装置、プログラム及びデータ処理方法
14日前
富士通株式会社
カスタム特徴量エンジニアリングのための単位予測
27日前
富士通株式会社
グラフェン光素子及びグラフェン光素子の製造方法
今日
富士通株式会社
光ノード装置、光通信システム、及び波長変換回路
14日前
富士通株式会社
基地局装置、無線通信システム、及び通信制御方法
4日前
富士通株式会社
機械学習プログラム、機械学習方法及び機械学習装置
4日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
17日前
富士通株式会社
通信装置、無線通信システム及び送信ランク切替方法
26日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
18日前
富士通株式会社
位置測位プログラム、情報処理装置及び位置測位方法
18日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
5日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
4日前
続きを見る