中国の個人情報取り扱いの恐ろしさ(DeepSeek, ChatGPT)

DeepSeekが公式サイトで明らかにしている個人情報の取り扱いを読んでみてびっくりしたので、
その情報をまとめてみました。
 
DeepSeekは3つの情報を収集していると自ら明らかにしています。
「個人識別情報」、「自動収集情報」、「他ソースから収集する情報」です。
 
  • まず、DeepSeekが収集する「個人識別情報」は、ユーザー名、生年月日、メールアドレス、電話番号、パスワードが基本収集情報です。
    他にも、DeepSeekを使用している間に入力する文章と音声データ、アップロードするファイル、チャット記録などが自動的に保存されます。
    個人情報はほぼ全部提供されるとのことですね。
 
  • 次に「自動収集情報」です。
    DeepSeekを使わなくても、IPアドレス、デバイスモデル、OS、言語、キー入力パターンなどが自動的に収集されます。
    自動的に収集する情報には利用行動データも含まれています。
    DeepSeekの使用頻度と滞在時間、クリックパターン、検索記録などもユーザー分析や今後の広告のために収集されます。
 
  • 最後に「他ソースから収集する情報」は、ソーシャルメディア情報と購入履歴などです。
    ソーシャルメディア連動情報は、GoogleやApple ID、メールアドレスなどの基本的なプロフィール情報を収集します。
    購入記録は、Amazon・楽天など他のプラットフォームで何かを購入する時のユーザーの行動を確保し、後でカスタマイズされた広告に使用されます。
 
このように収集された情報は中国本土のサーバーに移転・保存されるので、
アカウントを削除しても引き続き保管されるとのことです。
 
いつも重要な内容は隠されています。
「収集された情報の第三者共有」に関する部分です。
広告パートナーと分析会社にデータを共有するとされており、最後には法的機関とも共有するとのことです。
中国で法的機関といえば、中国政府も当然含まれるでしょう。
 
データの収集と活用範囲は中国の法律に従うとされており、
中国は個人情報の収集や管理、活用に最も規制がゆるい国です。
 
恐ろしいほど個人情報の扱いが悪質だったので、
これがDeepSeekだけの問題なのか、ChatGPTの個人情報の取り扱いも確認してみました。
その結果、やはりDeepSeekとChatGPTの個人情報の取り扱いにはかなりの差がありました。

 

主な内容を整理すると下記の通りです。
 

まず、DeepSeekがChatGPTより追加で収集する項目のうち、

  • 注目される部分はユーザーのキーボード入力パターンとリズムです。
    人間はタイピング速度、パターン、リズムなどがそれぞれ異なります。
    データ分析の専門家によると、これは指紋や顔認識のような生体認証ほど敏感なデータだと言われています。
    ユーザーのキーボード入力パターンとリズムだけで誰だか確認することはできませんが、
    ターゲットを絞った後は、キーボード入力パターンとリズムの違いで本人確認が可能になる可能性があるとのことです。
 
  • 二つ目は収集した情報の共有です。
    DeepSeekは収集した情報を別途の同意過程なしに広告または分析パートナーと共有することができると明示されています。
    一方、ChatGPTは個人情報を広告目的で販売したり、第3者に共有しないことを明示しています。
 
  • 三つ目は、データの提供及び保存場所です。
    DeepSeekは収集されたすべてのデータを「中華人民共和国内の安全なサーバーに保存する」と明示しています。
    しかし、中国の国家情報法に基づき、中国政府はデータにアクセスすることができます。
    中国の国家情報法第7条には「中国のすべての組織と国民は、中国の情報活動を支持・支援・協力しなければならない」と書いており、自国企業が持つ民間データを要求することができます。
    DeepSeekはまた、関連法や政府の要請を遵守して情報を提供すると規約に明記しています。
 
  • 個人情報収集に対する拒否オプションの有無にも違いがあります。
    DeepSeekはユーザーがDeepSeekを利用する瞬間、すべての入力データが自動的に収集・保存され、これを防ぐ方法がありません。
    一方、ChatGPTはユーザーが設定を変更し、データがモデル改善に活用されることを拒否するオプションが提供されます。
 
中国の製品、アプリケーション、サービスなどは、規約をよく見ないと、個人情報をタダで渡すのと変わらないものが多いので注意が必要です。