兵庫県尼崎市昭和通三丁目90番地1(尼崎K.Rビルディング5階)
1日目:2017年8月13日(日)15:00〜18:00
2日目:2017年9月2日(土)15:00〜18:00
定 員:20名
参加費:全2回1,000円(当日会場で集めさせていただきます。)
画像分類や機械学習のライブラリなどを少しずつ触ってみて、次はテキスト解析をやりたいと思ってらっしゃる方も多いのではないでしょうか?今回、日本語の形態素解析からWord2Vecの使い方、CNN、RNN、LSTMなどの使い方を、特許データを使って参加者の皆さまと実践的に学んでいこうと考えております。1日目はせっかくのお盆休みかと思いますが、ご興味がある方はぜひご参加ください。
ご自身のPCにJupyter NotebookとTensorFlow、matplotlib、scikit-learn(t-SNE)、mecab、gensimをインストールしてきてください。
TensorFlowのインストールはこちら。(https://www.tensorflow.org/install/)
インストール方法がよくわからない方は、当日30分ほどお早めに来てください(可能な範囲でサポートさせていただきますが、PCのスペックや動作環境により、必ずしも環境構築できる保証はございませんので、ご了承ください)。
またインストールできなかった方のために、AWSに分析環境を用意しておくことも検討しています。
時間 | 内容 | 発表者 |
---|---|---|
15:00〜15:15 | 特許データの説明 | 宮崎国際特許事務所・宮崎 超史 氏 |
15:15〜15:30 | 初・中級者と上級者でレベル分け | |
15:30〜16:10 | Mecabでの形態素解析 | 税理士荒巻政文事務所・中井 友昭 |
16:20〜17:20 | Word2Vec | 笹野 泰正 氏 |
17:20〜18:00 | 特許データから単語ベクトルを可視化する | 宮崎国際特許事務所・宮崎 超史 氏 |
word2vec で単語ベクトルを可視化し、 女王、王様、男、女 の典型的なベクトル表現を見る。
1.文章を単語に分ける方法を学ぶ
2.単語ベクトルに変換して、自然言語においてのニューラルネットの入力値を作る
時間 | 内容 | 発表者 |
---|---|---|
15:00〜15:15 | 特許データの説明 | 宮崎国際特許事務所・宮崎 超史 氏 |
15:15〜17:30 | 【初・中級者向け】パーセプトロン、CNNによる分類 | 入江 敦央 氏 |
15:15〜17:30 | 【上級者向け】RNN、LSTMによる分類 | 笹野 泰正 氏・宮崎 超史 氏 |
17:30〜18:00 | 各チームの成果発表 |
各班が何かしらの精度を出すこと。
パーセプトロン CNN
RNN LSTM
の書き方
ソレイユデータ道場では、中小企業の経営者、起業家、研究者、IT技術者、学生、データサイエンティストらが集まり、自分たちの手で中小企業の現場のデータ分析を実践します。 普段あまり社会的接点のない異質な者同士の集まりから、新たな知見やイノベーションの創出を目指します。 1.目的 ソレイユデータ道場は、主として下記の4つの場として機能し、関西圏におけるデータサイエンス分野の裾野の拡大と中小企業...
メンバーになる