TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2023147968
公報種別公開特許公報(A)
公開日2023-10-13
出願番号2022055780
出願日2022-03-30
発明の名称文字列変換プログラム及び文字列変換方法、並びに情報処理装置
出願人富士通株式会社
代理人個人
主分類G06F 40/129 20200101AFI20231005BHJP(計算;計数)
要約【課題】漢字及び平仮名を含まない文字列を精度よく仮名漢字文に変換する。
【解決手段】文字列分類部は、処理対象の文字列を、変換前文字列(図9(a)の矢印A,B参照)と変換済文字列とのいずれかに分類し、処理対象の文字列が変換済文字列に分類された場合には、頻度更新部が、処理対象の文字列に含まれる単語の情報で頻度DB44を更新する。また、処理対象の文字列が変換前文字列に分類された場合には、文字列変換部は、頻度DBを参照して、処理対象の文字列に含まれる単語を仮名漢字文(図9(b)の矢印A’、B’参照)に変換する。
【選択図】図9

特許請求の範囲【請求項1】
処理対象の文字列を、漢字及び平仮名を含まない第一の文字列と、前記第一の文字列以外の第二の文字列と、のいずれかに分類し、
前記処理対象の文字列が前記第二の文字列に分類された場合に、単語の使用状況を記憶する記憶部を、前記処理対象の文字列に含まれる単語の情報で更新し、
前記処理対象の文字列が前記第一の文字列に分類された場合に、前記記憶部を参照して、前記使用状況に基づいて、前記処理対象の文字列に含まれる単語を変換する、
処理をコンピュータに実行させることを特徴とする文字列変換プログラム。
続きを表示(約 980 文字)【請求項2】
前記処理対象の文字列を入力したユーザ又は組織が前記処理対象の文字列を入力する前に漢字または平仮名を含む文字列を入力していた場合には、前記処理対象の文字列が漢字及び平仮名を含まない場合でも、前記分類する処理において前記処理対象の文字列を前記第二の文字列に分類する、ことを特徴とする請求項1に記載の文字列変換プログラム。
【請求項3】
前記更新する処理及び前記変換する処理において用いる前記記憶部は、前記処理対象の文字列を入力したユーザ又は組織に対応する記憶部である、ことを特徴とする請求項1又は2に記載の文字列変換プログラム。
【請求項4】
前記変換する処理では、カタカナから漢字に変換する変換候補を格納する変換候補格納部を参照して、前記処理対象の文字列に含まれる単語の変換候補を複数特定し、複数の前記変換候補それぞれの前記使用状況に基づいて、前記処理対象の文字列に含まれる単語を変換する、ことを特徴とする請求項1又は2に記載の文字列変換プログラム。
【請求項5】
処理対象の文字列を、漢字及び平仮名を含まない第一の文字列と、前記第一の文字列以外の第二の文字列と、のいずれかに分類し、
前記処理対象の文字列が前記第二の文字列に分類された場合に、単語の使用状況を記憶する記憶部を、前記処理対象の文字列に含まれる単語の情報で更新し、
前記処理対象の文字列が前記第一の文字列に分類された場合に、前記記憶部を参照して、前記使用状況に基づいて、前記処理対象の文字列に含まれる単語を変換する、
処理をコンピュータが実行することを特徴とする文字列変換方法。
【請求項6】
処理対象の文字列を、漢字及び平仮名を含まない第一の文字列と、前記第一の文字列以外の第二の文字列と、のいずれかに分類する分類部と、
前記処理対象の文字列が前記第二の文字列に分類された場合に、単語の使用状況を記憶する記憶部を、前記処理対象の文字列に含まれる単語の情報で更新する更新部と、
前記処理対象の文字列が前記第一の文字列に分類された場合に、前記記憶部を参照して、前記使用状況に基づいて、前記処理対象の文字列に含まれる単語を変換する変換部と、
を備える情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、文字列変換プログラム及び文字列変換方法、並びに情報処理装置に関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
自治体において固定資産税などの情報を管理するシステムには、各種機能が設けられているが、例えば、入力された資産等を表す文字列が間違えて入力されていないか、入力すべき文字列が抜けていないか等を判定する機能等があると、自治体の職員等にとって便利である。このような判定機能を実現するためには、単に文字列の一致・不一致を確認するだけでは足りず、意味が似ているものをまとめ、まとめた範囲内で入力間違いや過不足があるか等を判定する必要がある。
【0003】
従来、文字列を多次元の特徴ベクトル化して抽出する技術が知られている。この技術によれば、同意語などを近いベクトルに割り当てることができるため、類似している文字列をまとめたりすることができる。
【先行技術文献】
【特許文献】
【0004】
特開平8-202706号公報
特開平8-95970号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、固定資産税などの情報を管理するシステムの中には、カタカナ文(平仮名や漢字を含まない文字列)しか入力できないシステムも存在している。カタカナ文は、意味を持つ単位に分割することが難しく、分割できたとしてもどのような意味であるかを判別するのが難しい。
【0006】
このようなカタカナ文を精度よく仮名漢字文(平仮名や漢字を含む文字列)に変換することができれば、仮名漢字文に含まれる単語に基づいた特徴などを抽出することができ、類似度を算出できると考えられる。
【0007】
1つの側面では、本発明は、漢字及び平仮名を含まない文字列を精度よく変換することが可能な文字列変換プログラム及び文字列変換方法、並びに情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
一つの態様では、文字列変換プログラムは、処理対象の文字列を、漢字及び平仮名を含まない第一の文字列と、前記第一の文字列以外の第二の文字列と、のいずれかに分類し、前記処理対象の文字列が前記第二の文字列に分類された場合に、単語の使用状況を記憶する記憶部を、前記処理対象の文字列に含まれる単語の情報で更新し、前記処理対象の文字列が前記第一の文字列に分類された場合に、前記記憶部を参照して、前記使用状況に基づいて、前記処理対象の文字列に含まれる単語を変換する、処理をコンピュータに実行させるプログラムである。
【発明の効果】
【0009】
漢字及び平仮名を含まない文字列を精度よく変換することができる。
【図面の簡単な説明】
【0010】
一実施形態に係る情報処理システムの構成を概略的に示す図である。
図1の自治体税賦課サーバのハードウェア構成を示す図である。
自治体税賦課サーバの機能ブロック図である。
図4(a)は、文字列特定部が資産情報DBから取得する情報の一例を示す図であり、図4(b)は、変換辞書の一例を示す図であり、図4(c)は、頻度DBの一例を示す図である。
出力例を示す図である。
自治体税賦課サーバの処理を示すフローチャートである。
図6のステップS16の詳細処理を示すフローチャートである。
図6のステップS22の詳細処理を示すフローチャートである。
図9(a)~図9(c)は、一実施形態の概要を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
乗降調査装置
12日前
個人
自動販売機
19日前
個人
リユース統合システム
1か月前
日本精機株式会社
投影装置
12日前
個人
コメント配信システム
1か月前
日本精機株式会社
投影システム
13日前
個人
広告提供方法
1か月前
株式会社SUBARU
車両
20日前
個人
釣PAID降水確率ポイント
1か月前
小林クリエイト株式会社
RFタグ
19日前
株式会社SUBARU
車両
1か月前
個人
モノづくり知識情報システム
1か月前
個人
チラシ掲載位置表示システム
1か月前
個人
情報処理装置及びプログラム
1か月前
個人
コンピュータシステム
1か月前
株式会社協同印刷
防災・災害マウス
25日前
17LIVE株式会社
サーバ
12日前
株式会社ゼロボード
価格決定システム
11日前
太陽誘電株式会社
触覚生成装置
23日前
ユニパルス株式会社
プログラム、方法
1か月前
中国電力株式会社
ゲームシステム
1か月前
株式会社アジラ
姿勢推定システム
10日前
株式会社カネカ
異常推定システム
1か月前
株式会社イトーキ
分析装置
23日前
株式会社フォーバル
仕訳システム
1か月前
株式会社カクシン
管理装置
1か月前
株式会社mov
情報処理装置
1か月前
オムロン株式会社
操作制御システム
1か月前
個人
ディスプレイ・セットシステム
1か月前
個人
オーダーメイド品販売システム
1か月前
TDK株式会社
検出装置
1か月前
個人
ブロックチェーンと既存網との接続方法
1か月前
個人
言語翻訳システム及びプログラム
3日前
トヨタ自動車株式会社
ワーク保持装置
1か月前
日本電気株式会社
勤務管理装置
18日前
個人
デジタルコンテンツ提供システム
1か月前
続きを見る