Kaggle事例紹介「東京証券取引所の銘柄予測」
  • タグ画像

    Kaggle

2022-10-05

いままでの記事の中でも触れてきたように、データサイエンスはまだまだこれから活用が進んでいく領域です。

サイエンスという名がつくように、まさに、日々試行錯誤が繰り広げられ実用されるべく日進月歩で進化し続けていく領域となります。

昨今になって、実際にデータの活用を行う企業が増えて来ていますが、まだまだ日本全体で活用が盛んとは言い難い状態です。そのような中で、実際にその日進月歩で活用のための試行錯誤が繰り広げられる現場を見ることで、今後どのような発展が見込まれていくのか、予測を立てることが出来るとも言えます。

今回は、企業のデータ活用の前進として、多数のデータサイエンティスト達と共同でデータ活用を進めるプロジェクトを推進するKaggleと呼ばれるプラットフォームと、その取組について焦点を当てていきます。

目次

Kaggleとは

Kaggleとは、データサイエンティスト達が、自分たちのデータ分析力を磨く場として機能しているプラットフォームとなります。

kaggleとはカグルと読み、kaggleに参加し、スキルを磨く方々をカグラーと呼びます。

the home of Data Science & Machine Learning

と表記されるように、データサイエンスと機械学習の家と呼ばれ、世界中の、機械学習・データサイエンスに携わる約40万人が集まるコミュニティです。

Kaggleの中では、企業や政府などの組織と、データ分析のプロであるデータサイエンティストや機械学習エンジニアを繋げるプラットフォームとして機能しており単純にエンジニアと企業をマッチングするのではなく、コンペも行われ盛り上がりをみせています。

どういう目的で利用している人がいるか

企業や政府などの組織とのコンペとは、企業や組織が競争形式で課題を提示し、賞金と引き換えに制度の高い分析モデルを買い取るという仕組みです。

開催されるコンペは多種多様で、

・住宅価格の予測を行うために、間取りや、駅からの距離等といった複数の要因から、戸建て住宅の最終的な価格を予測する。
・有事の際のTwitterの投稿の有用性に目を付け、災害の発生状況を正しく測定するために、tweetの内容と状況から、自動で災害に関するリアルタイムの情報を収集するアルゴリズムを作る。
・飛行機内のパイロットの状況をリアルタイムで観察し、危険な状態になった場合自動でアラートをあげるアルゴリズムを作成する。

といったコンペが行われています。

事例紹介「東京証券取引所」

今回は、日本の経済と切っても切り離せない東京証券取引所の事例をご紹介していきます。

数秒単位で日本の経済を支える多数の企業の株価が変動し、またその価格を調整する東京証券取引所の仕組みや役割と、価格の予測を支えるデータ活用の事例を紐といていきます。
まずは知ってそうで、意外と知らない東京証券取引所に関して具体的に説明をしていきます。

東京証券取引所とは

基本的な話になりますが、証券取引所でやり取りをされる会社の株ですが、その全ての会社の株式が証券取引所で取引されるというわけではありません。

証券取引所で売買される株式の事を上場株式といい、株式を証券取引所に上場している会社を、上場企業といいます。

上場とは、会社が発行する株式を証券取引所で売買できるように、証券権取引所が資格を与えることをいい、その審査基準によって、市場が分かれています。

ちなみに、証券取引所は日本全国に4か所あり、具体的には、札幌、東京、名古屋、福岡となり、その中でも多くの上場会社の株式を扱っているのが東京証券取引所となります。

東京証券取引所の役割

そのような、東京証券取引所の役割は、公平で信頼でき、使いやすくわかりやすい市場を提供することで、それぞれの投資家が安心して取引を行い、一方で上場している会社は、安定して資金調達を叶えることが出来る市場を作ることが、役割となります。

その為に東京証券取引所が担っている仕事が下記となります。

株式市場の監視

証券会社からの注文に不自然な点はないかといった監視を行っています。

株式市場における株価は、世の中の様々な情報から影響を受けその価格が変わっていきます。

例えば、ある大企業の不祥事が報道され、関連会社の株価が大きく下がるといったニュースを耳にしたことが何度かあるのではないでしょうか?

そのように一つの報道、一つの情報で企業の価値が大きく変わってしまうため、東京証券取引所ではリアルタイムでニュースや新聞などを監視し、間違った注文や投資家の判断に大きく影響を及ぼす情報があれば、直ちに株式の売買を停止するケースもあります。

そうすることで市場の安全性や信頼性を守っているわけです。

取引のチェック

売買審査部門では、年間約3000件もの取引を分析し、適正な売買が行われているかをチェックしています。例えば、故意に株価を変動させる行為や、世の中に発表されていない情報を利用したインサイダー取引なわれていないかのチェックを行います。

公平性が保たれている市場で上場しているからこそ、その上場等行為に価値がある為、なんでもありの無法地帯と化してしまうことは株式市場にとっても、会社にとっても、投資家にとっても問題となる為、非常に重要な役割を担っていると言えるでしょう。

上場の審査

また、東京証券取引所では上場を希望する会社に対して、上場の審査を行います。

多数の法人が存在している中で、一部の会社が上場できるというだけあって、上場を希望する会社は後を絶ちませんが、その上場した会社が問題を起こしたり、世の中に悪影響を与えてしまう場合、その市場ひいては、その市場に上場しているほかの会社の価値をも大きく下げてしまいます。

その為、上場後のチェックはもちろんのこと、これから上場を行う会社の審査を厳格に行事も東京証券取引所の大切な役割となります。

システム

また、一日に膨大な取引を行うため、その取引の大半はコンピュータによって行われています。

多い日では1日に約1億件もの取引にも及ぶ東京証券取引所ですが、そのような規模の取引となると、人間ではとてもではありませんが対応できず、また世界各国からのリアルタイムな取引を行うため、システムが停止となるようなケースは許されません。

そのため、使いやすくまたセキュリティなども堅牢な、精度の高いシステムが投資家からは求められ、その要望を叶えることも大切な役割となります。

証券取引所とデータ活用

このように、膨大なデータを監視し、常に市場の公平性を保つ必要がある東京証券取引所では、設立当初こそアナログでの対応を迫られていましたが今やシステム化、データ活用が進んでいる領域となります。

前述した通り、株価の動き1つで莫大なお金が動き、その結果1つの会社に関わる大勢の人や会社の命運を左右するとなった場合、一つ一つの対応にも大きな責任が降りかかります。

そのような状況下で、近年では膨大なデータをもとに株価の動きを予測し、さらには自動売買によって証券所担当者が対応するよりも早く膨大な取引を実行することすら可能となっております。

そうすると、公平公正な取引を維持するためには、より高精度で、巷のAIよりも処理速度の速いAIを用いて株価の変動を予測し、先手先手で対応を迫られることとなります。

したがって、データ分析やデータ活用とは切っても切れない関係となっており、そのような状況から、東京証券取引所を題材にしたKaggleのコンペも行われております。

Kaggleコンペ「東京証券取引所の銘柄予測」

kaggleで行われたデータ分析のコンペでは、対象となったのは東京証券取引所ではなく、その取引市場で株の売買を行う投資家となりました。

投資家自身が、銘柄を分析するために用いるシミュレーションモデルの構築することで、より多くのお金が市場に集まり、投資家や企業がチャンスを掴みやすい市場が形成されていくというわけです。

本コンペでは、約2,000銘柄の中から、株式情報や過去の株価などの要素を分析し、期待されるリターンが最も高い銘柄を上位として、上位銘柄から下位銘柄までをランク付けし評価するというものでした。

最終的には実際のリターンとモデル上での結果を比較し、その制度を競うというものでした。

当コンペのモデルデータはすべて公開されており、そのモデルを見て新たに投資家の興味関心を獲得し市場へと還元するという目論見もあるそうで、約2000チーム以上が参加する結果となりました。

株価予測の実際の事例

実際に、データ分析を持ちいて株価の予測をおこなうということは投資家自身が行うことはもちろんの事、証券会社や証券所事態もデータ分析を用いて株価の予測を行い、高い精度を誇っております。

たとえば、三菱UFJモルガン・スタンレー証券が公開している日経平均株価の予測実験では、過去15年分の為替と株のデータの中から92種類もの経済指標をAIが学習し、現在の経済指標に当てはめることで予測を立てる仕組みを開発しました。的中率は90%だといいます。

より精緻な予測がなされればなされるほど、その先に見えるリスクやリターンも明確となりますので、うまくデータ分析を活用できる投資家がより多くの機会を得ることは間違いないでしょう。

その上で、属人的ではなく標準化されたシステムやアルゴリズムによってその機会を得ることが出来る以上、その手法は広く知れ渡っていき事になるでしょう。
その繰り返しの先にさらなるシステムの発展や新しい活用方法が生まれていくことになる為、今後も目の離せない領域となりそうです。




いかがでしたでしょうか。

このようにKaggleのコンペの内容を見ることで、発行元の会社の業界内での戦略や置かれている状況について、大枠の様子が見えてきます。

次回以降もKaggleのコンペを中心に多種多様な業界の取組の紹介や業界でのデータ活用の様子をご紹介していきますので、どうぞお楽しみに。

それでは、ここまでお読みいただきありがとうございました。

次回の記事でまたお会いしましょう。