日本最大規模の韻検索サイト:ライムデータベース

By | 2016/07/27

エンジニアは作ってなんぼ!
というわけで今回新しくウェブサイトを作成しました。
その名も「ライムデータベース
簡単に言うと韻を検索できるサイトです。

ただいま日本にはラップブームが来ています。来ていると信じています。
(ただ私がハマっているだけなのかもしれないですが。。。)
そのブームに乗っかってしまおうと思い作ったのがこのサイトです。

よく友達とラインとかをしていて、このワードで韻を踏みながら返信したい時ってあるじゃないですか?
そんなときに簡単に極上の韻を検索できたら、この上ない幸せだと思うんですよ。
実は韻を検索するサイトはすでに何個かあるんです。
ですが、どのサイトも検索結果がパッとしないものが多い。
そこで今回考えたのが、誰もが言葉の登録もできる韻検索サイトです。
韻を検索するということは、あるワードと同じ韻を探すので、もしデータベースに対象のワードが入っていなければ登録してもらう。
こうすることで数多のユーザの知恵と結晶を詰め込んだデータベースが完成するのではないかと考えました。

ちなみにベンチマークしている韻検索サイトは登録語数23万語です。
そして現在の私のライムデータベースの登録後数は約34万語です!!
早くも日本最大規模の韻検索サイトを作ってしまいました!!!

コンセプト

上記の通り誰もが追加することができる韻検索サイトです。
ですが、誰もが追加できるということは変なワードが追加される可能性があります。そこで、今回はワードを評価することをできるようにしました。
Good と Bad の2軸で評価できます。
こうすることでしっかりと登録されている韻が上部に現れるわけです。

注目して欲しいところ

評価をしてもらいやすいように評価ボタンを押してもらいやすくしました。
rhyme
正確に言うと押した時に小気味よい動作が入るようにしました。
ぜひ押して体験してみてください。

初期登録ワード

最初になんのワードも入っていない場合使われないで終わってしまうと考えたので、とにかくたくさんのワードを入れておこうと思いました。
まずはじめに悩んだのが、漢字をひらがなに直す方法です。
調べていくと「KAKASI」という漢字をかなに変換するプログラムを見つけました。
そしてこれで使うことで漢字をひらがなに直すことができました。(しかし、精度はあやしいところ)
次に国語辞典のコーパスを探しました。しかし、なかなか望ましいコーパスが見つかリませんでした。
そして見つけたのが Wikipedia のタイトルのコーパスです。
このコーパスを利用し大量にデータベースにワードを登録していきました。
(漢字が大量になると変な語句が入りすぎてしまうと思い、ひらがな・カタカナで始まるワードだけ入れました。)
そして、ウェブ上で見つけた四字熟語データを登録し、合計約34万語から検索できるようになっています。

作成にあたって

今回は PHP のフレームワークの一つ laravel を使用しました。
laravel を使った理由は昔使っていて、かなり使いやすかったからです。
しかし私が昔使っていたのはバージョン4のころで、現在バージョンは5にあがりかなり記述の仕方が変わっていて難航しました。
ただ嬉しいことにグーグルトレンドによると、現在の PHP のフレームワークでは laravel が一番人気になっています。
laravel
習得するモチベーションにもなりました。

使用しているサーバはお名前.com のレンタルサーバです。
これがなかなか遅くて困っています。もう少し使ってみて厳しそうだったら他のサーバに乗り換える予定です。


個人的にはかなりいけるんじゃないかと思っている「ライムデータベース」。
周知させた後どのくらいのユーザが使ってくれるのか今から楽しみであります。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です