トップページphp
118コメント36KB

【全文検索】groonga【senna後継】

■ このスレッドは過去ログ倉庫に格納されています
0001nobodyさん2011/11/01(火) 15:23:37.63ID:zBzeEu6N
ないようなので立ててみました

* groonga
http://groonga.org/ja/

* mysqlに組み込むgroongaストレージ(mroonga)
http://mroonga.github.com/

関連スレ
組み込み型全文検索エンジンSenna
http://hibari.2ch.net/test/read.cgi/php/1118762053/
0102nobodyさん2013/05/31(金) 04:59:57.68ID:???
トリトン使うことにしますた
0103nobodyさん2013/06/01(土) 00:02:56.00ID:???
>>101
http://mroonga.org/ja/docs/install.html#windows
0104nobodyさん2013/06/01(土) 00:08:19.27ID:???
>>103
not foundには変わりないけど・・どういう意味ですか?
0105nobodyさん2013/06/01(土) 00:22:35.73ID:???
>>104
ごめんなさい。確認するの忘れてた…
0106nobodyさん2013/06/01(土) 00:46:50.58ID:???
MLでWin版のテスト募集されてましたよ。
http://sourceforge.jp/projects/groonga/lists/archive/dev/2013-May/001410.html
0107nobodyさん2013/08/31(土) NY:AN:NY.ANID:???
隔週連載groonga
http://gihyo.jp/dev/clip/01/groonga

http://qiita.com/groonga
0108nobodyさん2013/09/11(水) 20:24:29.01ID:???
頻発にテーブルupdateすると壊れるからマジで使えない
0109nobodyさん2013/10/22(火) 16:49:55.87ID:???
mroongaでカンマ区切りでインデックスさせるにはどうしたらいいすか?
0110nobodyさん2013/11/22(金) 17:20:10.93ID:???
>>92
64bit版にしたら全く問題なかった
0111nobodyさん2014/01/05(日) 03:05:09.06ID:???
mroongaとして使ってて、導入コストも低いし性能も問題ないんだけど
何の前触れもなく検索が遅くなったりするのが怖い
0112nobodyさん2014/02/05(水) 10:56:52.51ID:k8lujHJw
groonga のテーブル定義がさっぱりわかりません。
例えば wikipedia のデータをストアしたい場合、
どーすればいいのでしょうか?
0113nobodyさん2014/02/07(金) 09:34:56.28ID:???
groonga-dev のメーリングリストで教えてもらったから勝手に転載するわよ!

# <field name="id" type="string" indexed="true" stored="true" required="true"/>
# Groongaではレコードを一意に識別する値はキーとして扱う。
# 必須。required="true"相当?
table_create Articles TABLE_PAT_KEY ShortText
# <field name="title" type="text_ja" indexed="true" stored="true" required="true"/>
column_create Articles title COLUMN_SCALAR Text
0114nobodyさん2014/02/07(金) 09:36:19.44ID:???
# <field name="revision" type="int" indexed="false" stored="true"/>
column_create Articles revision COLUMN_SCALAR Int32
# <field name="user" type="string" indexed="true" stored="true"/>
column_create Articles user COLUMN_SCALAR ShortText
# <field name="userId" type="int" indexed="false" stored="true"/>
column_create Articles user_id COLUMN_SCALAR UInt64
# <field name="text_ja" type="text_ja" indexed="true" stored="true" required="true"/>
column_create Articles text_ja COLUMN_SCALAR Text
# <field name="timestamp" type="date" indexed="true" stored="true" default="now" multiValued="false"/>
# default="now"相当の機能はありません。
column_create Articles timestamp COLUMN_SCALAR Time
0115nobodyさん2014/02/07(金) 09:37:39.49ID:???
# ↓のtype="string"の転置索引用の語彙表:
# <field name="id" type="string" indexed="true" stored="true" required="true"/>
# <field name="user" type="string" indexed="true" stored="true"/>
# Bigramでトークナイズする。
table_create Terms TABLE_PAT_KEY ShortText --default_tokenizer TokenBigram --normalizer NormalizerAuto
# indexed="true"に相当。
column_create Terms articles_text COLUMN_INDEX|WITH_POSITION|WITH_SECTION Articles _key,user

# ↓用の転置索引用の語彙表:
# <field name="title" type="text_ja" indexed="true" stored="true" required="true"/>
# <field name="text_ja" type="text_ja" indexed="true" stored="true" required="true"/>
# text_jaに相当するのは--default_tokenizer TokenMecab。
table_create JapaneseTerms TABLE_PAT_KEY ShortText --default_tokenizer TokenMecab --normalizer NormalizerAuto
# indexed="true"に相当。
column_create JapaneseTerms articles_text COLUMN_INDEX|WITH_POSITION|WITH_SECTION Articles title,text_ja
0116nobodyさん2014/02/07(金) 09:38:53.27ID:???
# ↓用の転置索引用の語彙表:
# <field name="timestamp" type="date" indexed="true" stored="true" default="now" multiValued="false"/>
# カラムに入っている値(タイムスタンプ)そのものをトークンとして使うので
# トークナイザーは指定しない。
# キーの型をTimeにしてArticles.timestamp(トークンの型)とあわせることがポイント。
table_create Times TABLE_PAT_KEY Time
# Articles.timestamp用の転置索引の定義。indexed="true"に相当
column_create Times articles_timestamp COLUMN_INDEX Articles timestamp
0117nobodyさん2014/02/07(金) 09:41:18.24ID:???
難しいだわさ。
0118nobodyさん2014/02/07(金) 15:45:35.46ID:???
groongaは一部中国語に対応してるみたいだけど、拡張すればその他の言語もいけるのかな
■ このスレッドは過去ログ倉庫に格納されています