PHPからMeCabを利用

インストール環境

事前準備

PHPライブラリ管理PEARをインストール

導入の設定

php-mecabの取得とビルド

PHPへmecab.soの設定とApacheの再起動

“PHPからMeCabを利用” の続きを読む

めかぶのインストール

形態素解析エンジンのめかぶ(MeCab)をインストール

  • 形態素解析とは(引用: Wikipedia

wikimedia

> 形態素解析(けいたいそかいせき、Morphological Analysis)とは、コンピュータ等の計算機を用いた自然言語処理の基礎技術のひとつ。かな漢字変換等にも応用されている。

Project Hosting

> MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです. 言語, 辞書,コーパスに依存しない汎用的な設計を 基本方針としています. パラメータの推定に Conditional Random Fields (CRF) を用 いており, ChaSenが採用している 隠れマルコフモデルに比べ性能が向上しています。また、平均的に ChaSen, Juman, KAKASIより高速に動作します. ちなみに和布蕪(めかぶ)は, 作者の好物です.

インストール環境

No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 14.04.1 LTS
Release: 14.04
Codename: trusty

事前準備

g++コンパイラをインストール

MeCabのインストール

設定

インストール

辞書のインストール

設定

インストール

上の「インストール」と同じ

動作確認

↑の実行結果↓

すもも 名詞,一般,,,,,すもも,スモモ,スモモ
も 助詞,係助詞,,,,,も,モ,モ
もも 名詞,一般,,,,,もも,モモ,モモ
も 助詞,係助詞,,,,,も,モ,モ
もも 名詞,一般,,,,,もも,モモ,モモ
の 助詞,連体化,,,,,の,ノ,ノ
うち 名詞,非自立,副詞可能,,,,うち,ウチ,ウチ
です 助動詞,
,,,特殊・デス,基本形,です,デス,デス
EOS