2023-07-26
1.
はじめに
2.
メタバースNFT不動産価格予想
3.
おわりに
皆さん、こんにちは!松本祐輝です!本記事では、メタバースのNFT不動産価格をChatGPT Code Interpreterで初期分析して、それをベースにDataikuでデータパイプラインを作成してみたいと思います。
相場よりも安いものを買って、相場で売れば儲かりそうですね!
使うデータは、Kaggleで公開されている「Decentraland NFT Virtual Estate Dataset 2022」です。
まずは、ChatGPT Code Interpreterで初期分析してみましょう。とっても楽ちんですね。
・・・
思ったより大変でしたが、不動産価格予測の結果は、以下のようになりました。ある程度予測は出来そうです。
ChatGPTで、不動産価格が予測できそうという結果が得られたので、本番化に向けてDataikuでデータパイプラインを作成していきます。
ここからは、データベース(PostgreSQL)に格納されている想定で進めます。
PostgreSQLにあるデータをDataikuで読み込みます。Dataikuでは、ソースがファイルでもデータベースでも全く同じように扱えるので便利ですね!
次にPrepareレシピを使ってデータの加工を行います。
座標の展開や隣接してる道や地区、広場までの距離の展開、不要なカラムの削除などを行っています。
学習用のデータとテスト用のデータに分割して、学習用データで予測モデルを構築します。
今回は、指標をRMSLE、アルゴリズムは「Random Forest」「Ridge Regression」「LightGBM」の3つを試した結果、Random Forestが最も良い結果になりました。
Random Forestのモデルをデプロイし、テストデータに対して予測を実行します。
結果、下図のようになりました。高額の物件に関して予測が上手く行ってないのが分かります。
この辺りは、外れているデータに関して生データを確認し、どんなデータを収集すると改善しそうなのか仮説を立てて試行錯誤する必要がありそうです。
本記事では、メタバースのNFT不動産価格をChatGPT Code Interpreterで初期分析して、それをベースにDataikuでデータパイプラインを作成してみました。ChatGPTで当たりを付けて、Dataikuで本番化に向けて詰めていくという流れがイメージ出来たのではないでしょうか?
最後に、今回作成したフローを載せておきます。