[ 初めての方へ | 一覧(最新更新順) | 全文検索 | 過去ログ ]
『旧漢字を常用漢字に変換』(じゅん)
回答が付かないようなので、まぁ一案として 「旧字体 変換」でGoogle検索 http://www.google.co.jp/search?q=%E6%97%A7%E5%AD%97%E4%BD%93+%E5%A4%89%E6%8F%9B 旧漢字を新漢字に変換してくれるWEBページやフリーソフトがある様なので、 それらを用いてExcelで管理されている名前の情報を変換してみるとか。 (ご近所PG)
同窓会名簿なんだから、同じ人物の情報が旧漢字のものと常用漢字のものがあったら人間が判断して正しいほうに修正すべきでしょう。 例えば渡邊惠子が正しい名前なのに、渡辺恵子に直されたら本人怒りますよ。 (yama)
余計なことかもしれませんが、こういう個々人の判定というのは名前だけ、 というのは危なくありませんか?
旧字体・新字体を統一すれば本来別人のはずが同一人物と判定される虞があります。 名前、生年月日の二つで判定しても別人を同一人物と判定してしまう虞はまだあります。
名前、住所で判定すればその虞はぐっと減ります。 最低二つ、出来れば三つ以上の項目で判定するようにしましょう。
ただ、登録時に名前等を二重チェックするなどして入力しておかないと本来同一人物である ところを名寄せ時に別人と判定してしまう虞はあります。
名寄せするときはある程度のところまでは機械任せにするにしても最終的には人間の目で 確認することになると思います。判定項目を多くすれば多くするほど別人を同一人物と 判定する虞は少なくなりますが、登録時にキチンと入力しておかないと同一人物を別人と 判定する可能性が大きくなります。 ですので、最終的には人間の目による確認が必要になってくるのです。
女子サッカーワールドカップで活躍した「さわ」選手は報道機関によって「澤」「沢」 それぞれでした。 これが会社からの挨拶状などとなると字の間違いは許されません。下手をすると社長が 菓子折りをもって先方にお詫びに行く、という事態にもなりかねません。
(カリーニン)
タイトルに対する安易な回答について色々と意見を頂いた格好で、お恥ずかしい限りです。 しかし色々な案や懸念事項が上がってなかなか有意義な物になって来て喜ばしい限り。 引っ張り上げて良かった。 質問者のじゅんさんがご覧になっているか分かりませんが、 ここまでに書かれたような懸念はあるという前提で考えると安心でしょうね。 例えば変換した名前について、オリジナルをそっくり置き換える事はせず、 A列にオリジナルの名前 B列に常用漢字に変換した名前 としておいて、 A列の情報でマッチすればそのまま、マッチしなければ参考として B列の情報でマッチするか見る、その上で目検は欠かさない。 って感じの使い方は良いかもですね。 検索エンジンとかの仕組みじゃないけど、 渡邊さんでヒットしなかった時に「もしかして:渡辺」みたいな。 これとは別の質問にもあったけど、例えばカナ検索する際に 「ヂ」を「ジ」にした列を検索用として持っておいてあいまいにヒットさせるって手法に似てますね。 もちろん、その検索結果から「これが欲しかった情報!」って選び出すのはあくまでも検索した人だよ、 この検索結果は絶対ではなくて情報を見つけ易くする為に出しただけなんだからね、勘違いしないでよね、 って所まで含めて。 まぁ、長々と書いたけど結局の所、どれだけの件数を処理するか分かりませんが 「マッチしなかった物だけ抽出したリスト」同士で突合せして、 過不足を手直しする方が手間や間違いが少ない気はしますね。 (ご近所PG)
[ 一覧(最新更新順) ]
YukiWiki 1.6.7 Copyright (C) 2000,2001 by Hiroshi Yuki.
Modified by kazu.