【新サービスのお知らせ】リサーチ&コンテンツ[詳細はこちら]※料金付き
BtoB WEBページのPR集客とコンバージョンを引き上げる総合サービスメニューです。ターゲット設定、全体企画、調査実施、分析コンテンツ、プレスリリース、ダウンロード用白書制作まで。特設ページで詳しくご案内しています。
ChatGPT (チャットGPT)テキストマイニング 準備と概要
【GPT_Textminingシリーズ一覧リンク】
- 第1回 入門編・グーグルスプレッド&API
- 第2回 グーグルスプレッド・サマライズ等
- 第3回 通常の対話型インターフェイスを使った単語抽出など
- 第4回 マイニングツールKH-Coderとの連携について
- 第5回 ワードクラウドを表示するHTMLを作る
- 第6回 エクセルをそのままコードインタープリターで加工する
【はじめに】
アンケート調査やカスタマーサポートの業務では、顧客の自由回答や問い合わせ等のテキストを分析する作業が必須です。アンケート分析の世界では20年ほど前から、テキストマイニングという技法が注目され、様々なソフトウエアやサービスが生み出されてきました。
しかし、20年たった今も大規模な事業での使用は耳にしても、中小レベルまで広く普及したとはいい難い状況で、この背景にはソフトウエアやサービスのコストが高いことが大きいのではないかと思っています。
ChatGPTの登場から、すぐにテキストマイニングへの活用法を模索していたのですが、Python等の専門知識もなく、どうAPIを使って実現すべきかをずっと考え込んでいました。
2023年3月末あたりから、ポピュラーなPCアプリケーションとの連携が紹介されはじめ、エクセル等のスプレッドシートへの組み込み情報に注目していたところ、グーグルスプレッド用の機能拡張が使えそうだと気が付き、早々に使ってみました。
結果として、あっけなく分析ができ、事業規模に関わらず、誰もが気軽に使えるテキストマイニングツールになり得ると思ったので、まずこちらで”さわり”をご紹介することにしました。今後も引き続き、試行錯誤した結果を報告します。
【事前準備事項】
- OpenAIのAPIアカウントの取得
- グーグルスプレッド用のアカウントの取得
- スプレッドシートアドオン”GPT for Sheets and Docs”のインストール
- テスト用のテキスト(1行1人で2~30人程度のコメントテキスト)
【必要スキル】
- スプレッドシートで基本的な関数が使えること
- テキストマイニングとしてどんな結果が有効かを想像できること
【動画】
- 実際の使い方を説明しています。
スプレッドシートの使い方
【作業説明】
作業のイメージは、スプレッドシート用の関数(アドオンによって提供される)を使い、対象となる行のテキストについて、分析条件を記入したセルの内容をAIに分析させて結果を表示する感じです。使い慣れたスプレッドシートの作法に近いので、とっつきやすいと思います。
1.基本作業
-
一行一列のテキストデータをA3以下に複数行入力しておく(分析対象テキスト)
-
拡張機能からGPT for Sheets and Docs/Launch Sidebarを選びSidebarを表示
-
API_Keyを入力(下左)
-
Sidebarが(下右)のようなメニューになれば準備完了
2.実際の操作例
アドオンに含まれる関数を使って、実際に作業をしてみましょう。
(上記メニューの”LIST of GPT function”から、このアドオンで使える関数の一覧が見られます)
例1)感情分類
対象の文をあらかじめ指定した分類に分け分類名を表示します。
ここでは、1セルごとに記入された文章が、ネガティブなのかポジティブなのかGPTに判定させます。
関数と書式
[ =GPT_CLASSIFY(評価対象セル,分類指定セル) ]
A3セルのテキストを、B1セルにカンマ区切り入力しておいた性質で分類するように、上記の関数をB3セルに記載します。
B$1として参照先を固定し、そのままオートフィルで同じ関数コピーします。
レスポンスに多少時間がかかりますが、全ての自由回答にネガ・ポジの分類が記されます。
例2)主題分類
主題が何なのかをGPTに分類してもらいます。分類用のコードE1に入力しておきます。
関数は先程と同じなので、感情分類に使ったB3セルをE3セルにコピペすればOKです。
オートフィルで下までコピーすると、全ての回答をE1に記入したコードのどれか一つに分類してくれます。
例3 TAG付け
関数と書式
[ =GPT_TAG(評価対象セル,分類指定セル) ]
対象の文内に含まれている要素をTAGとして複数表示します。CLASSIFYがSA的(単一選択)であるのに対し、MA的(複数選択)になります。タグクラウドを作成するときなど、計量する際はこちらを使うことになります。選択肢型質問と同様に計量することができますが、代表的な定性を探る際の手がかりになります。※この作業の精度はあまり高くないので、改善方法が見つかれば報告しますね。
あとがき
文章に何が書かれているのか?何に分類されるのか? 形態素解析に比べて、どこか人間臭さが感じられのが面白い。
本来、文章を読み解くというのは、読み手のクセや気分が影響するものだが、GPTにはそういう匂いがする。
第2階では、そういう”ゆるさ”がもう少し感じられるはずです。
第2階ではグーグルスプレッドを使った、もう少しAiらしい分析を動画付きで紹介しています。
第3回では、ChatGPTの対話型画面を使った方法をご紹介しています。誰でも手順を踏めばできる、単語の出現率とセンチメント分類の方法を動画付きで具体的書いています。
外部ブログ記事になりました。【リンク】
G-Pointサービスを提供している、ジー・プラン株式会社のビジネスブログに関連記事を投稿しました。●対話画面を使ったテキストマイニング
・サマリー作成
・単語出現率
・ワードクラウド
※以上のプロンプト見本(テスト用アンケート自由文付き)
※抱きあがったワードクラウドのHTML見本●グーグルスプレッド・アドオン=GPT for Sheets and Docsを使った感情分析
・APIの取得方法(詳細)
・GPT for Sheets and Docsのセットアップ(詳細)
・感情分析(センチメント分析)
・発言分類…択一型と複数型(詳細)●ChatGPTを使った顧客体験調査の設計
・設問案の作成
丁寧な解説や見本データが掲載されていますので、ぜひご一読ください。
よしざわ
シリーズ記事リンク:[第1回][第2回][第3回][第4回][第5回][第6回]
【新サービスのお知らせ】リサーチ&コンテンツ[詳細はこちら]※料金付き
BtoB WEBページのPR集客とコンバージョンを引き上げる総合サービスメニューです。ターゲット設定、全体企画、調査実施、分析コンテンツ、プレスリリース、ダウンロード用白書制作まで。特設ページで詳しくご案内しています。
- 投稿タグ
- ChatGPT