「テレビ、ラジオ営業収入予測」ってどうやってるの?:後編 ~AIモデルの超謎~ 「データが語る放送のはなし」⑰

木村 幹夫
「テレビ、ラジオ営業収入予測」ってどうやってるの?:後編 ~AIモデルの超謎~ 「データが語る放送のはなし」⑰

(前編はこちらから)

後編では、AIを用いた予測についてお話しします。民放連研究所でも1年ほど前から、AIを利用した予測を行っています。ひとくちにAIといっても幅広い概念ですが、機械学習を用いた予測モデルの構築を行っています。

AIを用いた分析手法とは?

本題に入る前に、最初が肝心ですので概念の整理をしておきます。AI(人工知能)を用いた分析手法には、大きく分けて機械学習、ニューラルネットワーク、ディープラーニングの3つがあります。ですがこれらは独立した別の手法ではなく、AI>機械学習>ニューラルネットワーク>ディープラーニングという関係です、つまりAIの一種が機械学習であり、その一種が人間の脳の神経回路を数学的に再現したニューラルネットワークであり、そのうち、非常に多くの変数を同時に扱い、答えが定義されていない問題でも自分で学習しながら解いてしまうのがディープラーニングということができます。

機械学習って何?

では機械学習とはそもそも何? ということで、今回もChatGPT先生にお出ましいただきます(いや、これホント便利だわ)。"機械学習について、わかりやすく200字以内で"とお願いしました。

機械学習は、コンピュータにデータを使用して学習させることで、人工的に学習を行わせる技術です。学習データから規則やパターンを抽出し、未知のデータに対して予測や分類を行うことができます。これにより、人間の作業を効率化したり、人工知能のアプリケーションを開発することができます。

要するにコンピュータに、データを与えると、自分で勝手に学習して答えを出してくれる、というものです。前回ご紹介した回帰モデルによる予測は、人間がモデルの形と使用する手法を指定して推計し、いろいろな試行錯誤、何回もの計算を経て、もっとも予測に適していると思われるモデルを(最終的には)人間が選び、それを用いて予測を行います。機械学習ではデータを与えれば、それに適した手法を選んで勝手にモデルを構築し、最終的に最も正解率が高いモデルを返してくれます。使う側の人間にその分野の高度な知識が必須とされないだけでなく、手間と時間の両方を大幅に節約できるわけです。

機械学習のデメリット

じゃあ"もう人間はそんな面倒な分析する必要なくない?"と思いますよね? それはそのとおりかもしれません。でも、機械学習にもデメリットはあります。そもそも、機械学習では、なぜ結果がそうなっているのかを、使う側の人間が完全に把握できないのです。例えば、ChatGPTを始めとする対話型AIのベースにもなっている、ニューラルネットワークモデルは、構造化、前処理されていない膨大なデータを瞬時に扱えますが、返ってくるのは結果だけで何をどうやっているのか、なぜそうなるのかさっぱりわかりません。次に同じ状況になっても同じ結果が返ってくる保障もありません。いわゆる"ブラック・ボックス"です。

一方、機械学習で一般的に使われる、与えられたデータを似通ったグループ別に次々と段階的に(樹形図状に)分けて、モデルを当てはめていく決定木(ディシジョン・ツリー)法などを使えば、分析のプロセス把握が可能で、結果の解釈も、きちんと解釈するにはそれなりの知識が必要ですが、ある程度は可能です。しかし、自分でモデルを作った場合のように詳細に理解し、解釈することは不可能ですし、用いるAIツールによっては、データの処理法や用いる手法が適切だったのかどうかの検証もできません。

要するに機械学習による予測は、なぜそうなったのかがわかりにくいので、ほかの人に説明するのが難しいのです。この"人に説明できない"というのは、予測をやってそれをほかの人に伝えている立場の者にとって、大きなデメリットです。「なぜそういう予測値になったんですか?」と聞かれた時に、「よくわかりませんが、AIがそう言ってます」では、普通、許してもらえません。その理由はどうでもよいからとにかく予測したいという場合や、自分自身の投資判断や自分のお店の需要予測に使う場合には、こんなことは問題にならないのかもしれませんが。

月次スポットを予測する機械学習モデル

それでもAIは需要予測に有用です。民放連研究所では、変動が大きく、説明要因がよくわからない月次スポットの予測に、機械学習モデルを使用しています。テレビは、東阪名(15社)、札福(10社)、ラジオは中波全社、FM全社の計4つのデータについて、ソニーネットワークコミュニケーションズが提供するPrediction OneというAI分析ツールを用いた予測を行っています。これは、ニューラルネットワークモデルと決定木法を組み合わせた分析を行うようです。予測モデルの構築を決定木法で行うので、プロセスと説明変数の寄与度等がある程度把握できます。もっとも、Pythonを使えば、自分でプログラムを書いて予測することも可能なのですが、情けないことに、筆者はそのために十分なスキルを持っておりません......。Pythonでのプログラミングに通じた方なら、ご自分でプログラムを書いてみることをぜひお勧めします。

スポットの先行指標を探せ!

ところで、前回ご紹介した日本経済研究センターの日本経済、企業収益の予測値は最小でも四半期単位です。予測値が入手できない月次の予測はどうやれば良いのでしょうか? そこで私たちが目を付けたのが、テレビ、ラジオの先行指標です。これまでの分析で、テレビ、ラジオスポット、なかでもテレビスポットは景気とほぼ同時に動くことがわかっています(ラジオはやや遅れる傾向もあります)。そこで景気よりも先行して動き、その動きにスポットが追随する月次の指標を見つけ出せば、説明変数の予測値がなくても、スポットの予測ができることになります。

月次の先行指標と言えばその代表格は、景気動向指数のひとつであるCI(コンポジット・インデックス)の先行系列です。CIは生産、消費、雇用、設備・住宅、金融などさまざまな分野から、景気の動向を敏感に示す指標を抽出して統合し、基準年を設けて指数化したものです。先行指数は景気全体よりも数カ月程度先行する11の指標をもとに算出されます。月次のスポット予測モデルではこれら11の指標を個別に説明変数に用います。CI先行系列の内訳や計算法などの詳細は内閣府経済社会総合研究所のサイトをご覧ください。

説明力はそこそこ......

例として、図表に月次東阪名テレビスポット(前年同月比:%)の分析例をお示しします。6カ月前のCI先行系列(11のうち8系列と総合指数を使用)で説明するモデルです。横軸にモデルによる予測値、縦軸に実績値を取るようにデータをプロットしました。予測と実績が完全に一致すれば、図に引いた原点を通る直線上にプロットされますので、直線からの散らばり具合で当てはまりの良しあしがわかります。

決定係数は0.62ですので、変動が激しい月次前年比予測としては、まあまあと言ったところでしょうか。平均誤差は8程度、誤差の中央値は4程度です。図を見ると点の分布は概ね直線に沿っているようにも見えますが、100%前後の予測値では実績値が90から110付近に縦に細長く密に分布しています。この水準の予測は、このモデルは苦手なようです。しかし、実績はこの水準になることがもっとも多いのですが......。

これでも使い始めた頃よりは、いろいろな試行錯誤の結果、説明力が上がったのですが、全体として、いまいちですね。予測値として公表するのは少しきついレベルです。別の説明変数も探していますが、先行性をもった変数はほかにはなかなかありません。このツールでは、元データの加工法や説明変数の選択で予測結果が変わりますので、さらにいろいろ試してみる必要がありそうです。AI予測ツールと言っても実際には完全にお任せにできるわけではなく、分析者にはそれなりの知識と経験、そして手間が必要です。

230217 改連載⑰図表.jpg

<図表. 東阪名月次テレビスポット前年比の
機械学習モデルによる予測と実績の関係

AIを使って予測できること(ほんの一部)

本稿では、需要予測におけるAIの活用について、民放連研究所が実施しているひとつの事例をご紹介しました。AIは需要予測以外の予測分野でも多種多様な使い道があるのは、みなさんご存じのとおりです。例えば、決定木法を用いた分析例で必ずといっていいほどテキストに出てくる有名な事例にタイタニックの生存予測分析があります。タイタニック号乗船者の生存か死亡かを目的変数とし、それを乗客名簿に記載されていた、性別、年齢、客室等級などで説明するものです。結果は、私たちが映画で見たとおり、1等か2等の客室にいた女性と子供は生存率が明らかに高いというものです。

この0か1かの非連続データの予測は、医療・医学研究の分野などではAI導入以前から広く使われてきましたが、ビジネスの分野では、例えば、クレジットの適格者かどうか? ある商品・サービスを購入するかどうか? あるいは人事分野で、社員が離職するかどうか? 内定者が内定を辞退するかどうか? といった予測が、AIを使って以前よりもずっと簡単にできるようになりました。

連続するデータの予測では、例えば放送業界では、ニューラルネットワークモデルを用いた視聴率予測自体はかなり以前から存在していましたが、AIツールを使うようになった近年は、その精度と利便性が飛躍的に向上したようです。以前は、専用のプログラムを高度な専門知識を持った分析者が動かして予測していたのが、最近では汎用のAIツールで簡便に、しかもはるかに多くの変数を取り込んで予測できるようになったようです。視聴率に影響する要因は多種多様にあると思いますので、AIツールは使えそうですよね。でも、ニューラルネットワークモデルを使うと精度の高い予測はできるかもしれませんが、視聴率に何がどのくらいの影響をどう与えているのか? がよく分からないので、視聴率を上げるための対策が取りにくいと思うのですが......。

AIによる予測は社会のありとあらゆる分野で使われていますが、筆者の個人的な考えでは、需要予測の分野ではAIモデルはまだ用途が限定されています。小売業や飲食業で日々の来店人数や売上などを予測し、原材料の仕入れやスタッフのシフトの参考にするような用途では威力を発揮しているようですが、放送業界の需要予測でどう活用できるのかは、さらに検討が必要です。

最新記事