2020/04/07 - ワード完全自動生成(日)

研究中のディープラーニングを使ったワード完全自動生成、日本語版がなんとなくできた。7単語で切っているので中途半端な文になってるけど、割といい感じ。これでもかなり面白いけど、もうちょっと精度上げればよさそう。括弧の対応とかがうまくいってるのがすごい。

前回の英語版は「ゼロから作るDeep Learning 2」ほぼそのものなのだが、日本語版はフリガナとかちょっと一工夫している。

コーパスはWikipediaの一部、形態素分析はNMecabを使っている。実装はC#、行列の内積計算だけCで書いているので、Xamarin使ってどのOSでも動かせる。

タイピングソフトと文章自動生成は相性が良いと思ってたけど、そのうち当たり前になるかな。ある分野の文章で、毎回違う文章を打てるのがいい。例えば夏目漱石の小説を学習したら、夏目漱石っぽい文章を打つタイピングソフトになったり、いろいろ可能性がありそう。


コメントする