先日、SIGNATE や Kaggle に加えて、Nishika というデータ分析コンペ サイトに登録しました。
そこで「中古マンション価格予測 2021夏の部」というコンペに取り組んでいるのですが、使えそうな公知の外部データを探すうちに、どうやらコンペの元ネタになったデータを見つけちゃったみたいなんですね。
とはいえコンペ向けにはそこから加工されている可能性もあるので、まずはこの外部データをそのまま当てたらどうなるんだろうと思ったら、異常な良スコアが出ちゃったんです (0 に近いほどよい)。
さすがにこれをそのままコンペに使う気はさらさらないので、評価用に利用しないという設定にしていました。
ところが。
いやいやいやいやこれ誰が見てもチート野郎になっちゃうでしょ
これは Nishika のバグってことでしょうか。
これでチート野郎の侮蔑と嘲笑を受けることになっちゃったら、どうしたらいいんでしょうかw
一応 web サイトのお問い合わせフォームから指摘というか苦情というか、コメントを入れておきました。
(2021/9/21 追記)
「やっちゃった」投稿は無事に消去してもらいました。
ただ、もともと [最終評価に利用] のトグルはあくまで「最終」評価に使うかどうかのもので、暫定スコアのランキングには否応なしに掲載されてしまうそうです。
「この外部データ、元ネタかな?」という確認目的の投稿は、常にチート認定のリスクを伴うということですね。。