徹底的にアウトプット志向

ITコンサルタントの日々の学びを徹底的にアウトプットするブログ

超簡単!3分で分かるMicrosoft ”LUIS”

目次

 

LUISとは何か?

LUISとはMicrosoft Cognitive Services の中で、自然言語理解を行うAPIのこと。

  • Language
  • Understanding
  • Intelligent
  • Service

の略。

 

LUISで何ができるか?

LUISでは、入力された文章が「どのような意図の文章か」を識別することができる。

文字だと分かりにくいので、下の図を見てほしい。

f:id:hajime1980:20171116003437j:plain

ここでいう「LUIS Application 1」というのがAIの頭脳だ。

この頭脳に対して、2つの作業をする。

AIを学習させる

この頭脳に対し学習させたい文章の意図である「Intent」を必要なだけ追加する。この図の場合以下の3つだ。

  1. 現在の時刻を知りたい
  2. {場所}の天気を知りたい
  3. ドルレートを知りたい

各Intentに対して「Utterance」という学習データを与え、「それぞれの文章がどの意図(Intent)に該当するか」を覚え込ませるのだ。

この図の場合、「Intent1 現在の時刻を知りたい」に対して3つの文章を与え、どの文章も同じ意図であると学習させている。

  1. 今何時
  2. 現在の時刻を教えて
  3. 現在時刻は?

AIを使ってみる

学習が済んだら、LUISのAPIが使えるようになる。覚え込ませた以外の文章で問い合わせをすると、どのIntentの文章かを判定した結果をJSON形式で返してくれる。

この図の場合、学習させていない別の文章「いま何時かな?」という文章をWebAPIで問い合わせると、各Intentの識別値(Score)がJSON形式で返される(Score以外にも色々返されるがここでは割愛)

この図の場合、「Intent1 現在の時刻を知りたい」のScoreが99%なので正確に意図を読み取っていることになる。

これがLUISのAPIだ。

頭脳(AI)はどの単位で作成されるか?

LUISの頭脳(AI)はこの図でいうと「LUIS Application1」に該当する。別の頭脳が必要な場合はApplicationwo別に登録することができ、用途に応じて使い分けをすることができる。例えば、「問い合わせChatBot用」「スマートスピーカー用」などを分けることができる。

 

LUISをAIチャットボットとして使う場合の注意点

LUISは問い合わせ対応のAIチャットボットに使われることが多く想定されるが、この学習は結構骨が折れる。

FAQの1つがLUISの「Intent」に該当する。仮にFAQを100個用意したとすると、Intentを100個作る必要がある。各Intentに対して3~10個ほどの学習をさせないと、ある程度正確な判定ができないため、この場合、言い回しを変えた問い合わせ(学習データ)を少なくとも300個くらいは用意する必要がある。これが骨が折れる作業なのだ。

それだけではない。AIは「学習データ」と「テストデータ」を別に用意する必要がある。とういうことかというと、学習させただけでは、ちゃんと人口知能が意図した働きをしているか判断できない。なので、学習データとは別の「テストデータ」でテストすることで文章が正しいIntentとして判定されるまで学習が進んだのかを確認する必要があるのだ。このテストデータが最低1パターンは必要になるので、合計するとFAQ100個に対して、300個の学習データと最低100個のテストデータが必要になってくる

 

もう少し踏み込んだ使い方

LUISをもう少し踏み込んだ使い方をすることができる。

EntitiesとFeaturesを使うことで「より便利に、より正確に」判定することができる。

 

少し長くなってきたので、この部分は次のブログで。

 

G Suiteの機械学習について

目次

 

 はじめに

最近AIについて色々勉強しているのですが、

「G Suiteの機械学習 がもたらす新しい働き方をご紹介! 」

という感じのセミナーがあったので行ってみました。

 

セミナーの学び

とりあえず先に学びだけ。興味ある人だけ下まで読んで下さい。

  • G Suiteで使われている機械学習はコレ
  • G Suiteは単機能だけでなく、色々使えばつかうほど便利に
  • Google Speech APIって読み上げAPIではないのね

 

G Suiteで使われている機械学習はコレ

機械学習で紹介されたのはこの3サービス。

多分これ以外も色々使っているのだと思うけど話には出てこなかった。

  1. Google Mail
  2. Google スライド
  3. Google Search

それぞれ詳しく見ていきます。

 

1.Google Mailのスパムメールフィルタなど

に使われている。悪意を持った攻撃などは日々進化しているので、10億ユーザーが使っているG Suiteが日々学習し進化しづけているとのこと。

f:id:hajime1980:20171114214316j:plain

2.Googleスライドのデザインテンプレートの候補表示

スライドの内容に応じてスライドに合ったデザインテンプレートを複数提示してくれる。この内容を識別するのに機械学習を使っている。これによってデザイン(見せ方)に時間を使わず中身により多くの時間が使えるようになる。

ちなみに写真は自分で選ぶ必要がありますが、Google画像検索やGoogle Driveを検索して比較的手軽に選択することができます。

Google画像検索だと著作権フリーの画像だけがヒットする模様。

Googleスライドをサンプルで作ってみました。

f:id:hajime1980:20171114215159j:plain

 使って見た感じ、カッコいいスライドを作れる気がするけど、あまりパターンは多くないっぽいアジェンダページとコンテンツページをサンプルで作って見たけど、同じデザインがサジェストされた。

 

3.Googleフォトと動画の自動検索

利用者は写真や動画をGoogleにアップロードするだけで、各ファイルにキーワードを設定することなく関連するワードで検索できるようになるそう。

例えば、「赤ちゃん」と検索すればGoogleに格納されている写真や動画の中から赤ちゃんに関する写真、動画が検索できる。もちろんユーザーはタグ付けやコメント登録しないで良い。

f:id:hajime1980:20171114220605j:plain

 

G Suiteは単機能だけでなく、色々使えばつかうほど便利に

f:id:hajime1980:20171114222308p:plain

G Suiteはメールが便利だからメールだけ使う。というような単品の使い方よりも、メール+ドライブ+カレンダー+ハングアウトといったように複数のサービスを使うことで、相乗効果が得られ、より便利になるという謳い文句。

 

例えば、

  • カレンダーで打ち合わせの予定を入れながら一緒にメール送ることができる(カレンダー+メール)
  • ハングアウトしながら、共有スプレッドシートで共同編集する(ハングアウト+スプレッドシート

といったことができる。

 

うーん。でもOffice365でも似たようなことできますよね。違うとすると、各サービスがシームレスに繋がっているかどうかの違い。
Outlookだとメールと予定表はスムーズに連携できるけどSkype for Businessは完全に別アプリ。会議招集とSkypeは連動しないので使い勝手は高くない。
多少使いにくくても、ITリテラシーが高い人にとっては問題ないレベルではあるけど、ITリテラシーが高くない人にすると、ものすごく生産性が悪くなる
ビデオ会議に繋げるのに手間取って15分オロオロ。なんてことありますよね?これで、参加者の貴重な時間が無駄になる。10人いたら150分分のロスだ。
なので、ITリテラシーが高くないユーザーにとってはG Suiteで固めて上げることで、生産性は上がるのだろうなー。と感じた。

 

シームレスに繋がるという観点の他に、メールやカレンダーに情報を入れることで、検索画面を開いた時点で「その時に必要な情報」をサジェストしてくれる。検索する前に必要な情報を提示してくれるのだ。

例えば、

  • カレンダーにある会社の訪問の予定が入っていた場合、その会社の情報が検索することなくサジェストされる。

そんなイメージだ。

 

まぁ、現時点ではサジェストされるものがどの精度の物かわからないけど、使ううちに学習して精度も上がってくるのだと思う。それが10億ユーザーの学習データを持ったGoogleの強みですね。

 

Google Speech APIって読み上げAPIではないのね

勘違いしてました。APIの名前から「文字」→「音声」を変換してくれるAPIだと思っていましたが、実際は「音声」→「文字」の変換をしてくれるAPIのようです。

f:id:hajime1980:20171114222041j:plain

使えそうな用途としては、

  • コールセンターの通話記録を文字起こしして分析に使う
  • 会議の文字起こしをして議事録の作成負荷軽減

とかですかね。

今度使ってみたいと思います。

 

ちなみに、機械学習APIは今回紹介したSpeech以外にも、Machine Learning API、Vision API、Transrate APIなどなどあります。

これらについてもそのうち触れていきたいと思います。

 

まとめ

Google Telework Loungeに行ってきた

はじめに

今日はとあるセミナーに出席するため六本木に行ったところ、「Google Telework Lounge」という期間限定のワーキングスペースが設置されていたので使ってみた。

 

快適に使えるワーキングスペースだし、利用料無料、コーヒー無料なのでカフェで仕事する人には結構オススメかも。あとは、六本木ヒルズで打ち合わせ、の前にここでひと仕事なんておしゃれな使い方もできますね。

 

11月中のみの期間限定なのでよかったらどうぞ。

 

 

外観

六本木ヒルズノースタワー 1Fにあります。

f:id:hajime1980:20171114203750j:plain

 

ワーキングスペース

オープンスペース、ミーティングエリア、半個室、個室など色々なパターンのスペースが用意されています。

 

↓オープンスペース。セミナーなどはここでやっているみたい。各席にはコンセントあり。

f:id:hajime1980:20171114204218j:plain

 

↓オープンスペースと奥にガラスで囲われた6人くらいが使える会議スペース

f:id:hajime1980:20171114204328j:plain

 

↓完全個室。もちろんこちらもコンセントあり。元々試着室だったのを改装して使っているらしい。空調はついているっぽかったけど、ものすごい暑かったのであまりオススメできない。

f:id:hajime1980:20171114204156j:plain

 

ファシリティ①(飲み物サービス)

↓水とコーヒー(エスプレッソとコーヒーが選べる)が無料!

f:id:hajime1980:20171114204727j:plain

 

ファシリティ②(無料WiFi

WiFiとはいえ、遅いと使い物にならないのでチェック。満席状態でしたが、14Mbps出てました。仕事のファイルをダウンロードしたり、リモートデスクトップ接続したりしましたが、ストレスなかったです。

f:id:hajime1980:20171114204940j:plain

 

ファシリティ③(トイレ)

トイレは施設にないとのこと。

地下?にレストランフロアがあるのでそこにいかないと行けない。

長時間使うときはちょっと不便かもね。

 

 

アウトプット始めよう!

はじめまして、ITコンサルファームで働いている「はじめ」です。

テクノロジー系で学んだことを整理してアウトプットしていきたいと思います。

 

基本的には自分のために書くつもりですが、自分の理解を整理する過程で「人に説明できること」ということが大切だと思っているので、少しくらいは世の中のためになるのではないかと思っています。

 

3日坊主ではなく、どこまで継続できるか心配ですが、とりあえず始めたいと思います。

 

Have Fun Tech Brog!