オープンデータ関連のニュースです。
日本語
人気のある出会い系サイトのほぼ 70,000 人のユーザーにデータのセットを発表したデンマークの研究者グループによって作られた引数であります。研究者は、web ページの部分をキャプチャ「スクレーパー」と呼ばれる自動化されたツールを使用-使用のウェブサイトの条項の違反があった。これらのユーザーは、薬物使用と性的嗜好のような親密なトピックに関する質問に答えていた。研究者は、彼らはそれのプロファイルの多くを reidentify することが可能であるにもかかわらず、それをリリースするときに、データ セットを deidentify の手順を取らなかった。研究者が Twitter でこの経過について呼び出されると、それらの 1 つそれを一蹴フリップ ステートメントで「データはパブリック既に」です。 私はこのすべての時間のような引数を聞きます。恥人マグカップ ショットの写真を公開しているウェブサイトは、彼らは公共の記録を使用するいると言います。
続きを読む…
English
That’s the argument made by a group of Danish researchers who released a data set on nearly 70,000 users of the popular dating website. The researchers used an automated tool called a “scraper” that captures parts of a webpage—a possible violation of the website’s terms of use. These users had answered questions on intimate topics like drug use and sexual preferences. The researchers took no steps to deidentify the data set when they released it, despite it being possible to reidentify many of the profiles. When the researchers were called out about this lapse on Twitter, one of them shrugged it off with the flip statement “Data is already public.” I hear arguments like this all the time. Websites that post mug shot photos to shame people say they’re just using public records.
Read more…