ビッグデータとかなんだとか言われてるけれども、
統計解析をするのが企業だけじゃなくて、ユーザ側からしてもいいよねってことで
javascriptでテキストマイニングをしてみた。
テキストデータを分かち書きするためには、tinysegmenterを使わせてもらいました。
そこから、tfidf値で値付けをして、k-means++でクラスタリングをした。
javascriptで作ったついでにブラウザで試せるサンプルも作った。気軽にテキストマイニングを試してもらえるとうれしい。
サンプルアプリケーション Text Mining(javascript)
コードは↓
github textmining-js
リンク
tinysegmenter
Data Mining Algorithms In R/Clustering/K-Means
Introduction to Information Retrieval
0 件のコメント:
コメントを投稿