mecabを使ってみる。

 漢字ーカナ変換機能を どうしても使う必要が有って mecabをインストールしてみました。

mecabの詳しい事については 開発元サイトを見てください。

 昔は pukiwikiで保存されているファイルの名前をあいうえお順に表示させる為に 漢字ーカナ変換プログラムとして chasenを使っていました。 この・・ chasen ちょっと変換機能が・・・ あれでして、誤変換で後々になって あたふたさせられる事件が何回かありました。 ま これは余計な話・・ (汗

 今使っているサーバは Rocky Linuxのver8.5で chasenは dnfでインストールできません。私は基本ポリーシーとして dnfでインストールできるアプリしか使っていません。 ./configure+makeでインストールしてしまうと その後の何か問題が発生した時のフォローとか、バージョンアップとか 管理を自分でやらなければいけなくなります。そういっためんどくさい事は dnfの「自動アップデート機能」に任せています。

 今日 mecabがdnfでインストール出来る事が分かったので インストールして漢字かな変換機能を試してみました。 必要なソフトは 変換プログラム本体のmecabとその辞書であるmecab-ipadicの二つです。

[]# dnf install mecab
メタデータの期限切れの最終確認: 3:00:47 時間前の 2022年02月26日 15時38分32秒 に実施しました。
依存関係が解決しました。
================================================================================
 パッケージ
          Arch      バージョン                               リポジトリー サイズ
================================================================================
インストール:
 mecab    x86_64    0.996-1.module+el8.3.0+242+87d3366a.9    appstream    392 k
モジュールストリームの有効化中:
 mysql              8.0

トランザクションの概要
================================================================================
インストール  1 パッケージ

ダウンロードサイズの合計: 392 k
インストール後のサイズ: 2.1 M
これでよろしいですか? [y/N]: y
パッケージのダウンロード:
mecab-0.996-1.module+el8.3.0+242+87d3366a.9.x86 870 kB/s | 392 kB     00:00
--------------------------------------------------------------------------------
合計                                            389 kB/s | 392 kB     00:01
トランザクションの確認を実行中
トランザクションの確認に成功しました。
トランザクションのテストを実行中
トランザクションのテストに成功しました。
トランザクションを実行中
  準備             :                                                        1/1
  インストール中   : mecab-0.996-1.module+el8.3.0+242+87d3366a.9.x86_64     1/1
  scriptletの実行中: mecab-0.996-1.module+el8.3.0+242+87d3366a.9.x86_64     1/1
  検証             : mecab-0.996-1.module+el8.3.0+242+87d3366a.9.x86_64     1/1

インストール済み:
  mecab-0.996-1.module+el8.3.0+242+87d3366a.9.x86_64

完了しました!
[]# dnf install mecab-ipadic
メタデータの期限切れの最終確認: 3:01:53 時間前の 2022年02月26日 15時38分32秒 に実施しました。
依存関係が解決しました。
================================================================================
 パッケージ
           Arch   バージョン                                    Repo      サイズ
================================================================================
インストール:
 mecab-ipadic
           x86_64 2.7.0.20070801-16.module+el8.3.0+242+87d3366a appstream  11 M

トランザクションの概要
================================================================================
インストール  1 パッケージ

ダウンロードサイズの合計: 11 M
インストール後のサイズ: 51 M
これでよろしいですか? [y/N]: y
パッケージのダウンロード:
mecab-ipadic-2.7.0.20070801-16.module+el8.3.0+2 4.3 MB/s |  11 MB     00:02
--------------------------------------------------------------------------------
合計                                            3.6 MB/s |  11 MB     00:02
トランザクションの確認を実行中
トランザクションの確認に成功しました。
トランザクションのテストを実行中
トランザクションのテストに成功しました。
トランザクションを実行中
  準備             :                                                        1/1
  インストール中   : mecab-ipadic-2.7.0.20070801-16.module+el8.3.0+242+87   1/1
  scriptletの実行中: mecab-ipadic-2.7.0.20070801-16.module+el8.3.0+242+87   1/1
  検証             : mecab-ipadic-2.7.0.20070801-16.module+el8.3.0+242+87   1/1

インストール済み:
  mecab-ipadic-2.7.0.20070801-16.module+el8.3.0+242+87d3366a.x86_64

完了しました!
[]#

 インストール出来たので 早速テストしてみました。以下のような感じで変換結果が表示されれば インストールは成功です。 

[]# mecab
ここは何処?私は誰?今はいつ?
ここ    名詞,代名詞,一般,*,*,*,ここ,ココ,ココ
は      助詞,係助詞,*,*,*,*,は,ハ,ワ
何処    名詞,代名詞,一般,*,*,*,何処,ドコ,ドコ
?      記号,一般,*,*,*,*,?,?,?
私      名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ
は      助詞,係助詞,*,*,*,*,は,ハ,ワ
誰      名詞,代名詞,一般,*,*,*,誰,ダレ,ダレ
?      記号,一般,*,*,*,*,?,?,?
今      名詞,副詞可能,*,*,*,*,今,イマ,イマ
は      助詞,係助詞,*,*,*,*,は,ハ,ワ
い      動詞,自立,*,*,一段,連用形,いる,イ,イ
つ      助動詞,*,*,*,下二・タ行,基本形,つ,ツ,ツ
?      記号,一般,*,*,*,*,?,?,?
EOS
^C

 しかし こんな複雑な変換結果は 私には必要なくて 単純にコマンドラインに入力一発で 単純に漢字カナ変換してくれれば良いわけで・・・ そんな方法を試してみました。

[]# echo "ここは何処?私は誰?今はいつ?" | mecab -Oyomi
ココハドコ?ワタシハダレ?イマハイツ?
[]#

 ウ~~ム よしよし 後はphpのexecでコマンドとして実行して その結果を取り込んでしまえばOKです。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

This site uses Akismet to reduce spam. Learn how your comment data is processed.