diary/Kojima/2007-02-12
の編集
http://plamo.linet.gr.jp/index.php?diary/Kojima/2007-02-12
[
トップ
] [
編集
|
差分
|
バックアップ
|
添付
|
リロード
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
-- 雛形とするページ --
diary/Template
[[diary/Kojima]] ・怪盗アンデス再び 日本漢字能力検定協会が[[変"漢"ミスコンテストの第3弾:https://www.challenge-net.jp/henkan/]]を実施しているとか. 前回の年間変漢賞は「遅れてすみません.怪盗アンデス(回答案です)」だっ たそうだが,「かいとうあんです」という文字列を「回答案です」と変換 するか「怪盗アンデス」と変換するかをアルゴリズム的に判断するのは極 めて難しい印象. 「かいとうあんです」という文字列に対して「回答案」という単語と「怪 盗」「アンデス」という単語のどちらが妥当かというのは,この文字列を 対象とした変換レベルでは判断できず,前後の文脈を見ないと決定できな いように思う.「かいとうあんです。」みたいに文末を明示しておけば, 体言止めの「アンデス」よりは用言止めの「です」の方が妥当性が高くな りそうだいう判断は可能だろうけど,個人的にはそこまで「かな漢字変換」 というツールに任せるべきではないように感じてしまう.「かな漢字変換」 というのは,せいぜい辞書引きを簡易にすべきもので,文意の判断までそ こに任せてしまうのは思考の怠慢という気がする. まぁこのヘンも SKK に毒されていると言えばその通りなんだけど,SKK の 「(文節の区切りという)人間が判断した方が効率がいいものは人間が判断する」 という考え方は好きだし,機械と人間が棲み分ける一つの安定系を示している 気すらする.Plamo でも,こういう風に行き過ぎた自動化は自戒したいところ だけど,技術屋の常としてついついやり過ぎになりがちだから,どこでバラン スを取るかは判断が難しいところ.さらに難しいのは,このヘンの「常識」自 体が時代によって変っていくことなんだよなぁ.. -私はSKKは使っていないのですが、Emacsのleimでもやっぱり同じような感じかな。無理に長めの文章を変換しようとすると文節区切りの調整に手間を取られてしまうので、結局短い文節で区切って入力したほうが効率がよかったりします。あと、いにしえの8ビットOS OS-9で「熟語変換」を使っていましたが、それも慣れると結構快適に入力できていましたね。 -- [[川俣]] &new{2007-02-13 (火) 01:37:48}; #comment
タイムスタンプを変更しない
[[diary/Kojima]] ・怪盗アンデス再び 日本漢字能力検定協会が[[変"漢"ミスコンテストの第3弾:https://www.challenge-net.jp/henkan/]]を実施しているとか. 前回の年間変漢賞は「遅れてすみません.怪盗アンデス(回答案です)」だっ たそうだが,「かいとうあんです」という文字列を「回答案です」と変換 するか「怪盗アンデス」と変換するかをアルゴリズム的に判断するのは極 めて難しい印象. 「かいとうあんです」という文字列に対して「回答案」という単語と「怪 盗」「アンデス」という単語のどちらが妥当かというのは,この文字列を 対象とした変換レベルでは判断できず,前後の文脈を見ないと決定できな いように思う.「かいとうあんです。」みたいに文末を明示しておけば, 体言止めの「アンデス」よりは用言止めの「です」の方が妥当性が高くな りそうだいう判断は可能だろうけど,個人的にはそこまで「かな漢字変換」 というツールに任せるべきではないように感じてしまう.「かな漢字変換」 というのは,せいぜい辞書引きを簡易にすべきもので,文意の判断までそ こに任せてしまうのは思考の怠慢という気がする. まぁこのヘンも SKK に毒されていると言えばその通りなんだけど,SKK の 「(文節の区切りという)人間が判断した方が効率がいいものは人間が判断する」 という考え方は好きだし,機械と人間が棲み分ける一つの安定系を示している 気すらする.Plamo でも,こういう風に行き過ぎた自動化は自戒したいところ だけど,技術屋の常としてついついやり過ぎになりがちだから,どこでバラン スを取るかは判断が難しいところ.さらに難しいのは,このヘンの「常識」自 体が時代によって変っていくことなんだよなぁ.. -私はSKKは使っていないのですが、Emacsのleimでもやっぱり同じような感じかな。無理に長めの文章を変換しようとすると文節区切りの調整に手間を取られてしまうので、結局短い文節で区切って入力したほうが効率がよかったりします。あと、いにしえの8ビットOS OS-9で「熟語変換」を使っていましたが、それも慣れると結構快適に入力できていましたね。 -- [[川俣]] &new{2007-02-13 (火) 01:37:48}; #comment
テキスト整形のルールを表示する