Doorkeeper

【8/13・9/2】2回シリーズ『特許データを使って、自然言語処理を学ぼう!』@阪神尼崎

2017-08-13(日)15:00 - 18:00 JST

税理士荒巻政文事務所

兵庫県尼崎市昭和通三丁目90番地1(尼崎K.Rビルディング5階)

詳細

開催日時・定員・参加費

1日目:2017年8月13日(日)15:00〜18:00
2日目:2017年9月2日(土)15:00〜18:00
定 員:20名
参加費:全2回1,000円(当日会場で集めさせていただきます。)

対象者

  • テキスト解析や特許データに興味のある方、ご自身の研究やビジネスに活用したい方
  • ノートPCを持参できる方
  • 原則として、8/13、9/2両日とも参加できる方
  • Jupyter Notebook、Pythonの基本的な操作、プログラミングに慣れている方  ※テキスト解析の経験の有無は問いません。  

開催趣旨

 画像分類や機械学習のライブラリなどを少しずつ触ってみて、次はテキスト解析をやりたいと思ってらっしゃる方も多いのではないでしょうか?今回、日本語の形態素解析からWord2Vecの使い方、CNN、RNN、LSTMなどの使い方を、特許データを使って参加者の皆さまと実践的に学んでいこうと考えております。1日目はせっかくのお盆休みかと思いますが、ご興味がある方はぜひご参加ください。

事前準備

ご自身のPCにJupyter NotebookとTensorFlow、matplotlib、scikit-learn(t-SNE)、mecab、gensimをインストールしてきてください。
 TensorFlowのインストールはこちら。(https://www.tensorflow.org/install/)
 インストール方法がよくわからない方は、当日30分ほどお早めに来てください(可能な範囲でサポートさせていただきますが、PCのスペックや動作環境により、必ずしも環境構築できる保証はございませんので、ご了承ください)。
 またインストールできなかった方のために、AWSに分析環境を用意しておくことも検討しています。

1日目(2017年8月13日(日)15:00〜18:00)

タイムスケジュール(※当日変更になる可能性があります。)

時間 内容 発表者
15:00〜15:15 特許データの説明 宮崎国際特許事務所・宮崎 超史 氏
15:15〜15:30 初・中級者と上級者でレベル分け
15:30〜16:10 Mecabでの形態素解析 税理士荒巻政文事務所・中井 友昭
16:20〜17:20 Word2Vec 笹野 泰正 氏
17:20〜18:00 特許データから単語ベクトルを可視化する 宮崎国際特許事務所・宮崎 超史 氏

目標

word2vec で単語ベクトルを可視化し、 女王、王様、男、女 の典型的なベクトル表現を見る。

得られるスキル

 1.文章を単語に分ける方法を学ぶ
 2.単語ベクトルに変換して、自然言語においてのニューラルネットの入力値を作る

2日目(2017年9月2日(土)15:00〜18:00)

タイムスケジュール

時間 内容 発表者
15:00〜15:15 特許データの説明 宮崎国際特許事務所・宮崎 超史 氏
15:15〜17:30 【初・中級者向け】パーセプトロン、CNNによる分類 入江 敦央 氏
15:15〜17:30 【上級者向け】RNN、LSTMによる分類 笹野 泰正 氏・宮崎 超史 氏
17:30〜18:00  各チームの成果発表

目標

各班が何かしらの精度を出すこと。

得られるスキル

 パーセプトロン CNN
 RNN LSTM
 の書き方

コミュニティについて

SOLEIL DATA DOJO

SOLEIL DATA DOJO

ソレイユデータ道場では、中小企業の経営者、起業家、研究者、IT技術者、学生、データサイエンティストらが集まり、自分たちの手で中小企業の現場のデータ分析を実践します。 普段あまり社会的接点のない異質な者同士の集まりから、新たな知見やイノベーションの創出を目指します。 1.目的 ソレイユデータ道場は、主として下記の4つの場として機能し、関西圏におけるデータサイエンス分野の裾野の拡大と中小企業...

メンバーになる