「テレビ、ラジオ営業収入予測」ってどうやってるの?:前編 ~回帰モデルの謎~「データが語る放送のはなし」⑯

木村 幹夫
「テレビ、ラジオ営業収入予測」ってどうやってるの?:前編 ~回帰モデルの謎~「データが語る放送のはなし」⑯

先日「2023年度のテレビ、ラジオ営業収入見通し」の記事を掲載しました。この営業収入見通しは、毎年1月に翌年度の予測値を発表し、年度半ばの9月にその改訂を行っています。今回と次回は、前・後編に分けて、「テレビ、ラジオ営業収入見通し」でどうやって予測を行っているのかについてご紹介してみたいと思います。

とはいえ、あまり細かい手順のようなことを話しても仕方ありませんので、近年はやりの"データサイエンス"にも関連する、予測モデルの話に絞ってみたいと思います。前編では、時間の経過に沿ったトレンドで予測する時系列モデルと並んで、需要予測に使われるモデルの代表格であり、テレビ、ラジオの予測でも中核的なモデルとして使用している"回帰モデル"について取り上げます。

回帰モデルとは

テレビ、ラジオ営業収入の予測を行うに当たっては、まず、①民放連会員社営業担当責任者へのアンケート調査、②(経済・企業収益を説明変数とする)回帰モデルによる予測、の2つの手法を用いて予測を行います。その後、両者を比較検討しながら最終的な予測値を決めます。

上記のうち、アンケート調査は営業担当の方が、その時点で考えている予測値を集計するためのものです。個社の経営計画やイベント・事業等の予定、それぞれの地区の固有事情、営業担当者が把握しているクライアントの状況など、筆者らが知らない、あるいは知りえない情報を反映させた貴重なデータを得ることができます。

では、"回帰モデル"による予測とは何なのでしょうか? 毎年、この見通しを発表するたびに決まって何件か「回帰モデルって何ですか」というお問い合わせをいただきます。

そこで、今話題のChatGPTに聞くと以下のように答えてくれました。

回帰モデルとは、変数間の関係を数学的にモデル化することを目的とした統計モデルの1つです。特に、つの説明変数(または複数の説明変数)を用いて、目的変数を予測するタスクを回帰問題と呼びます。

回帰モデルは、常に完全に正確な予測を行うことはできませんが、実際のデータに基づいて変数間の関係を説明することができます。回帰モデルは、予測やデータ解析のために多用されます。例えば、株価の予測、物価の予測、顧客の忠誠度の予測などが挙げられます。

なるほど! よくわかりましたね。では今回はこれでおしまい......というわけにもいかないので、人力で多少捕捉します(それにしても良い回答......)。

営業収入全体をGDP
インターネット広告費で説明

以下、一例として、年度のテレビ営業収入全体(タイム+スポット+その放送事業収入+テレビ単営社のその他事業収入)を予測するための回帰モデルをお示しします。

営業収入(金額)=a+b×名目国内民間需要(金額)+c×インターネット広告費(金額)+誤差

左辺を被説明変数または目的変数、右辺の名目国内民間需要、インターネット広告費を説明変数といいます。テレビ営業収入の場合、テレビ全社、東阪名、系列ローカル、独立局の4つの回帰モデルがありますが、説明変数は全て同じで、ab、cの値がそれぞれ異なります。

名目国内民間需要は、名目GDPから国内の民間需要だけを抜き出したもので、輸出入や公的需要を含むGDPよりも広告支出を説明するのに適しています。インターネット広告費(電通ベース、制作費を含む総額、暦年)を入れているのは、言うまでもなく、これがテレビ営業収入にマイナスの影響を与えているからです。

ab、cはパラメータ推定値と呼ばれることもありますが、aは定数項、bcはそれぞれ名目国内民需とインターネット広告費に係る係数です。名目国内民需の係数はプラス、インターネット広告費の係数はマイナスになります。

回帰モデルは、ごく単純化して言えば、過去のデータに上記の式を当てはめ、誤差の総和(平方和)が最小になるようなパラメータ推定値(ここではab、c)を推定したものです。上記のモデルの説明力は決定係数(相関係数の二乗)でテレビ全社、東阪名で0.910.92、系列ローカルで0.88、独立局で0.77です。決定係数は、モデルが推計した被説明変数の予測値が、実績値とどのくらい合致しているかを示しており、0.0(全然違う)~1.0(完全一致)の間の値になります。独立局を除いてはそう悪くない当てはまり具合だと思います。

系列ローカルと独立局のモデルの当てはまりがやや悪いのは、マクロレベルの景気とはあまり関係なく動くローカル広告が多く含まれているためと考えています。ローカル広告の比率は系列ローカルでは3割程度ですが、独立局ではそれよりずっと大きくなります。ローカル広告に影響する要因は、エリアによってさまざまと考えられます。全国一律の要因ではとらえきれません。

なぜ予測ははずれるのか?

ChatGPTが言うように、回帰モデルは「常に完全に正確な予測を行うことはできません」。過去のデータに比較的よく当てはまっているからといって、常に正確な予測ができるわけではないのです。上の式の場合、これを使って、例えば2023年度のテレビ営業収入の予測値を計算するには、右辺の名目国内民需とインターネット広告費の2023年の予測値をまず代入しなければ計算できませんよね? 回帰モデルに限らず、計量モデルでは、このようにモデルの外から与えられる変数を外生変数と言います。モデルの説明力が100%でないだけでなく、この外生変数の予測値(=予測の前提条件)自体に不確実性があるので、"完全に正確な予測"は絶対に不可能なのです。

加えて、時系列の回帰モデルの場合、過去の一定期間における非被説明変数と説明変数の関係を表しているわけですから、その後、両者の関係が変化すれば、モデルの構造も変化します。予測する時点で既に構造が変化していれば、うまく予測できません。

前提条件の変化に対応するには?

民放連研究所では、GDPや、今回はご紹介していませんがスポットの予測モデルに使用する法人企業収益について、その予測値は日本経済研究センターの経済予測を使用しています。同センターは日経新聞系のシンクタンクですが、大規模なモデルを構築し、それをかなりのマンパワーも用いて運用して、最終的な予測値を出しています。政府予測などとは異なり、ニュートラルな立場から、信頼性が高い予測を出していると評価されている機関です。しかし、昨年1月に民放連研究所が発表した「2022年度のテレビ、ラジオ営業収入見通し」で使用した時点の日経センターの経済予測(202112月発表)は、当時は当然のことでしたが、ロシアによるウクライナ侵攻とその長期化を織り込んでいませんでした。2022年度のテレビ営業収入は1月時点では2%程度のプラス予測だったものが、結果として、2%程度のマイナスになりそうです。

前提条件に不確実性が大きい場合は、シミュレーションのように、前提条件を変えた別の予測値も提示するという方法があります。昨年はそれをやっておくべきだったかなと反省しております......。

回帰モデルは、19世紀にその原理が提唱された、理論面でも実証面でもある意味使い古されたモデルですが、勉強すればするほど奥が深いモデルです。筆者などはまだまだ到底極めることはできていません。

回帰モデルは、近年、コンピュータの情報処理能力向上で可能になったさまざまなモデルのベースにもなっています。後編では、回帰分析の考え方をベースにしながらも、異なるアプローチで予測を行うAIを用いた予測モデルについてご紹介します。AIは需要予測の分野にも地殻変動をもたらしています。

最新記事