オープンデータとプログラミング

ブルームの約束は、バトン ルージュのビジネス コミュニティとの関係を閉じる|Broome promises close relationship with Baton Rouge business community

オープンデータ関連のニュースです。

https://www.businessreport.com/article/broome-promises-close-relationship-baton-rouges-business-community

日本語

市長シャロン ウェストン ブルームは、今日 8 月洪水から再構築中の経済開発の許可のプロセスとフォーカスから赤テープを削減する有望な彼女の政権の初期で、バトン ルージュのビジネス コミュニティと緊密に連携すると誓った。 最後の夜に発足されて以来の彼女の最初のスピーチ、ブルームは、ビジネス、投資、LSU の Lod クック同窓会センターで開催バトン ルージュ周辺地域商工会議所の月例昼食会で地域社会のリーダーの満員の部屋を演説しました。 ブルームは言った彼女はブラチ島とその代表取締役社長、彼女の移行チームで作業しているアダム ナップと緊密に連携します。 「(洪水) 回復は長い旅、」ブルームは言った。「それは難しい 1 つのマラソン-クイック スプリントではないです。まだ景気回復を洪水の復旧には必要不可欠です。
続きを読む…

English

Mayor Sharon Weston Broome today pledged to work closely with Baton Rouge’s business community in the early days of her administration, promising to cut red tape from the permitting process and focus on economic development while rebuilding from the August flood. In her first speech since being inaugurated last night, Broome addressed a packed room of business, investment and community leaders at the Baton Rouge Area Chamber’s monthly luncheon taking place at LSU’s Lod Cook Alumni Center. Broome said she will work closely with BRAC and its president/CEO, Adam Knapp, who is working on her transition team. “(Flood) recovery is a long journey,” Broome said. “It is a hard one, a marathon—not a quick sprint. Yet it is absolutely essential that flood recovery is economic recovery.
Read more…

データ ポータルにもかかわらずシカゴ K を支払った $670 昨年オープンの記録違反|Despite Data Portal, Chicago Paid $670K Last Year for Open Record Violations

オープンデータ関連のニュースです。

http://www.govtech.com/data/Despite-Data-Portal-Chicago-Paid-670K-Last-Year-Open-Record-Violations.html

日本語

(TNS)-シカゴ市に支払わ約 $670,000 昨年オープン記録法を職員に違反訴訟に原告-ほぼ結合前の 8 年間で支払ったを都市もの 5 回。 専門家と弁護士は言った情報自由法の場合取付ペイアウトが政府を運営する”最もオープン、責任、透明なシカゴの街が今まで見たこと”市長ラームエマニュエルの誓約について懸念を提起彼らは、増加はより広範な国民の権利をレコード撮影 Laquan マクドナルドなどの高プロファイルの例によって拍車をかけ意識に起因するかもしれないと述べた。 まだ開いているレコードの違反を主張する 54 訴訟に直面している、エマニュエルの管理は、公開情報をより効率的に提供するためにリソースを追加した言います。
続きを読む…

English

(TNS) — The city of Chicago paid out about $670,000 last year to plaintiffs in lawsuits alleging that officials violated open records law — nearly five times what the city paid in the previous eight years combined. Experts and attorneys said the mounting payouts in Freedom of Information Act cases raise concerns about Mayor Rahm Emanuel’s pledge to run “the most open, accountable and transparent government that the city of Chicago has ever seen.” They said the increase may be attributable to a broader awareness of the public’s right to records spurred by high-profile cases such as the Laquan McDonald shooting. The Emanuel administration, which still faces 54 lawsuits alleging open records violations, says it has added resources to provide public information more efficiently.
Read more…

オープン データ科学政府の透明性が促進します。|Open Data Science Drives Transparency in Government

オープンデータ関連のニュースです。

http://insidebigdata.com/2017/01/02/open-data-science-drives-transparency-in-government/

日本語

TranslateApiException: Cannot find an active Azure Market Place Translator Subscription associated with the request credentials. : ID=1446.V2_Json.Translate.279B51CF
続きを読む…

English

In this special guest feature, Michele Chambers, EVP Anaconda Business Unit & CMO, Continuum Analytics, discusses how in 2015, President Obama appointed DJ Patil as the first Chief Data Scientist and Deputy Chief Technology Officer for Data Policy to focus on using data to shape policies and practices, and how going forward it is important for all governments to understand that Data Science is crucial to all decision making. Michele is an entrepreneurial executive with over 25 years of industry experience. She has authored two books; Big Data Big Analytics, published by Wiley, and Modern Analytic Methodologies, published by Pearson FT Press.
Read more…

世界特許の評価問題高リスク報告書: 特許バブルの用心しなさい|World Patent Ratings Issues High Risk Report: Beware of the Patent Bubble

オープンデータ関連のニュースです。

http://www.prweb.com/releases/worldpatentratings/patent-bubble/prweb13953446.htm

日本語

世界特許の評価、専門評価機関と無形資産評価に焦点を当てた専門家のネットワークが新しい発行高リスク報告書タイトル「特許バブルの注意してください”。世界特許の評価は、世界中の企業のバランス シート上の無形資産の不合理な評価に関心を呼び出す先駆者をされています。 同社の取締役会には、大使 Dell デイリー元海軍中将アル Konetzni、元米国弁護士マシュー · ウィテカー、イスラエル国防軍の一般的な折り Nuriel、世界特許会社家族・ クーパー アイデア財団のディレクター博士アイリーン マーティとスコット ・ クーパー社長など著名な人物が含まれています。
続きを読む…

English

World Patent Ratings, a specialized rating agency and expert network focused on intangible asset valuation, has issued a a new High Risk Report titled “Beware of the Patent Bubble.” World Patent Ratings has been a pioneer in calling attention to the irrational valuation of intangible assets held on corporate balance sheets around the world. The company’s Board includes notable figures such as Ambassador Dell Dailey, Former Navy Vice Admiral Al Konetzni, former US Attorney Matthew Whitaker, General Nitzan Nuriel of the Israel Defense Forces, Dr. Aileen Marty, and Scott Cooper, CEO of the World Patent Family of Companies and Director of The Cooper Idea Foundation.
Read more…

オープン データ計画|Open Data Plan

オープンデータ関連のニュースです。

https://dribbble.com/shots/3189109-Open-Data-Plan-Icon-pattern

日本語

TranslateApiException: Cannot find an active Azure Market Place Translator Subscription associated with the request credentials. : ID=0642.V2_Json.Translate.2798F332
続きを読む…

English

Once again, a designer trying to create visual elements for an abstract concept such as Open Data. 😛 This icon pattern is just a little part of a project about the Open Data Plans of the different Ministries of Argentina.
Read more…

ODI 言う都市の回復力を高めることができます データを開く|ODI says open data can boost urban resilience

オープンデータ関連のニュースです。

http://www.ukauthority.com/data4good/entry/6770/odi-says-open-data-can-boost-urban-resilience

日本語

弾力性都市プランナー必要がありますもっと密接に働く自然と人工の応力とショックに抵抗を構築するオープン データ専門家主題のレポートによると。 オープン データ研究所 (ODI) はカナダの体を開く北オープン データによる都市の復元をどのように改善することができますを生成すると提携ですか。先月公開, どのようにオープン データ当ててドキュメントは都市の回復力を強化するため使用ことができます計画。 重要なメッセージが、堅牢なローカルおよびグローバルなデータ インフラストラクチャなど関連する機関、データセット、技術、トレーニング、ポリシーと規制の必要性といいます。 それはまた 2 つのコミュニティが、これまでずっと一緒に働いていないと容易にそうことのために 5 つの提言は、強調しています。
続きを読む…

English

Resilience planners in cities should work more closely with open data specialists to build up the resistance to natural and manmade stresses and shocks, according to a report on the subject. The Open Data Institute (ODI) teamed up with Canadian body Open North to produce How can we improve urban resilience with open data? Published last month, the document focuses on how open data can be used to beef up cities’ resilience planning. It says the key message is a need for robust local and global data infrastructures, including the relevant organisations, datasets, technology, training, policies and regulation. It also emphasises that the two communities have not worked much together so far, and comes up with five recommendations to make it easier for them to do so.
Read more…

「情報エントロピー」超入門|ウィキペディアでは理解できなかったエンジニアのために…

エントロピーとはいっても高校化学で習った熱力学におけるエントロピーではありません。
機械学習(ランダムフォレストなど)の解説を見ているとでてくるアレです。

でも、エントロピーに関する説明をウィキペディアで読んだけどわからなかった、そんなことはありませんか?

それでは、ウィキペディアでの説明をみてみましょう。

情報理論においてエントロピーは確率変数が持つ情報の量を表す尺度で、それゆえ情報量とも呼ばれる。
確率変数Xに対し、XのエントロピーH(X)は
entropy-formula
(ここでPiはX = iとなる確率)
で定義されており、これは統計力学におけるエントロピーと定数倍を除いて一致する。この定式化を行ったのはクロード・シャノンである。
これは単なる数式上の一致ではなく、統計力学的な現象に対して情報理論的な意味づけを与える事ができることを示唆する。
情報量は確率変数Xが数多くの値をとればとるほど大きくなる傾向があり、したがって情報量はXの取る値の「乱雑さ」を表す尺度であると再解釈できる。
よって情報量の概念は、原子や分子の「乱雑さの尺度」を表す統計力学のエントロピーと概念的にも一致する。

うーん、ちょっとピンときませんね。^^;
「確率変数が持つ情報の量を表す尺度」とか言われても理解できないですよ~

ただ、一行目に重要なことが書いてあります。

「情報理論においてエントロピーは確率変数が持つ情報の量を表す尺度で、それゆえ情報量とも呼ばれる。」

だそうです。

エントロピーは情報量とも呼ばれている、らしいです。

エントロピー = 情報量

と考えてよいということですね。

エントロピーの計算式を考える前に、まず情報量とは一体何者なのかを考えてみましょう。

私達も「情報量」という言葉は日常的によく使います。
例えば、「このブログは情報量が多い」などと使います。
「情報量が多い」という言葉のニュアンスとしては、単に記事の文字が多いというより、記事内容が充実している、
といったことを指しているように思います。

例えば、次のような2つのブログ記事があったとします。

記事A: 今日は雪だった。今日は雪だった。今日は雪だった。…<繰り返し>… 今日は雪だった。※全100文あるとします!
記事B: 朝から関東の広い範囲で雪が降った。北日本から関東の上空に寒気が入った影響のためだ。都心の最低気温は2度だった。

あなたは、どちらが情報量が多いと感じるでしょうか。
記事Aは100文もありますが、得られる情報は「今日は雪だった」ということだけです。
一方、記事Bは少なくとも3つの情報が含まれています。「雪が降ったという事実」、「雪が降った原因」、「最低気温」といった情報が含まれています。

直感的には情報量は、記事B>記事Aだといえるでしょう。

このような問題を感覚的ではなく、数学的に扱おうというのが情報理論(Information theory)という学問です。
エントロピー(情報エントロピー)は、情報理論の概念です。
情報理論の基本的な応用としては、ZIP、MP3などがあります。
とても身近な技術ということがお分かり頂けるかと思います。

さて、冒頭のウィキペディアの説明に戻りましょう。

「情報理論においてエントロピーは確率変数が持つ情報の量を表す尺度で、それゆえ情報量とも呼ばれる。」

さきほど直感的に情報量は、記事B>記事Aであると書きました。
であれば、エントロピーも、記事B>記事Aの関係が成り立つはずです。

それをこれから確認してみましょう。

先程の記事A、Bを確率的に扱うために、形態素に分解してみます。
/(スラッシュ)は区切り位置がわかりやすいように記載しています。

記事A: 今日/は/雪/だっ/た /。/…<繰り返し>…/今日/は/雪/だっ/た /。/ ※全100文!
記事B: 朝/から/関東/の/広い/範囲/で/雪/が/降っ/た/。/北/日本/から/関東/の/上空/に/寒気/が/入っ/た/影響/の/ため/だ/。/都心/の/最低気温/は/2/度/だっ/た/。/

続けて記事A、Bの形態素を数えて表にしてみます。
そして、先ほどのエントロピーの計算式に当てはめて、EXCELで計算しちゃいましょう。
結果は、記事Aが2.00、記事Bが5.45となり。
予想どおり、記事Bのほうがエントロピー(情報量)が高いという結果になりました。

entropy

計算式の解説については、また別日に追記したいと思います。

機械学習の概説が中心になりますが、基本的なことから勉強するなら以下の本がおすすめです。

■アマゾンで買うならこちら

■楽天で買うならこちら

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

事例+演習で学ぶ機械学習 [ 速水悟 ]
価格:3024円(税込、送料無料) (2017/1/2時点)

検索のためのデューデリジェンス生産サポート: 方法を見つける A 偉大な 1 つです。あなたが本当に.|Searching For A Due diligence Producing Support: How To Locate A Great One. Do you really …

オープンデータ関連のニュースです。

http://www.opendata-27-76.fr/searching-for-a-due-diligence-producing-support/

日本語

検索のためのデューデリジェンス生産サポート: 方法を見つける A 偉大な 1 つです。あなたの宿題のヘルプは本当に必要ですか。 作曲支援研究を検索するたびに、すべてのトピックまたはおそらく生産に焦点を当て人々 のグループが含まれているクラスが必要なかどうかを決定してください。作曲は、weeknesses をすることができます、彼らの唯一の集中はライティング、チームでビジネスを行う最大でしょう。理想的な補完の検索中を考慮する必要があります様々 なものがあります。認定インストラクターがチームを活用する必要があります、生産、価格やプランに合ったものにカスタマイズだけを使用します。 いくつかの構成プロバイダーより手頃な価格を提供するために修飾されたフリーランスのライターを使用しないように傾向があります。
続きを読む…

English

Searching For A Due diligence Producing Support: How To Locate A Great One. Do you really need help with your Homework Task? Whenever you locate a research composing assistance, you should determine if you need a class that includes all topics or perhaps a group of people that focuses on producing. If composing can be your weeknesses, it will be greatest to do business with a team as their only concentrate is writing skills. There are various stuff you should consider while you search for the ideal complement. You should utilize a team which has certified instructors, one that just uses customized producing, then one that matches your price and plan. Some composing providers tend not to use qualified freelance writers in order to provide more affordable prices.
Read more…

バス追跡クリックするだけ|Bus-tracking only a click away

オープンデータ関連のニュースです。

http://www.nyoooz.com/bengaluru/699058/bustracking-only-a-click-away

日本語

詳細オプション: 車のオープン データを 10 秒ごと更新されます。以上で初めて公営交通株式会社、カルナータカ州道路輸送株式会社は、アプリ開発者や研究者と共有するプラットフォームを共有オープン ソース リアルタイム更新データを開発しました。プラットフォームは、当局は 1 月末には、ロールアウトに設定されます。リアルタイム更新されたデータで、たとえばタクシー可用性をこのようなデータに依存するアプリケーションの使用で爆発とインドを含む世界の通勤都市革命をもたらしました。公共交通機関にデータの可用性を拡張した場合、通勤者はより多くのオプションを持っているし、KSRTC のイニシアチブは、その方向にステップ。
続きを読む…

English

MORE OPTIONS: Open data on vehicles will be updated every 10 seconds. more-in In a first for a government-run transport corporation, the Karnataka State Road Transport Corporation has developed an open source real-time updated data sharing platform to be shared with app developers and researchers. The platform is set to roll out by January-end, officials said. Real-time updated data has revolutionised urban commuting the world over, including India, with an explosion in the use of apps that rely on such data for taxi availability, for example. If the data availability is extended to public transport, commuters will have more options and KSRTC’s initiative is a step in that direction.
Read more…

python: pandasでnull値を判定する

python

pandasでnull値を判定する方法のメモです。
isnull()やnotnull()を使用します。
ちなみに、データフレームにnull値を設定するときはNoneを入れます。

import pandas as pd

df = pd.DataFrame({
        'A' : [1, 2, 2, 3, 3,None,5],
        'B' : [1, 1, 2, 2, None,4,5]
    })

print df
print '------------------------'
print df.loc[df.A.isnull(), :]     #Aがnullの行を表示
print '------------------------'
print df.loc[df.B.isnull(), :]     #Bがnullの行を表示
print '------------------------'
print df.loc[df.A.notnull(), :]    #Aがnull以外の行を表示
print '------------------------'
print df.loc[df.B.notnull(), :]    #Bがnull以外の行を表示

実行結果は以下のようになります。

     A    B
0  1.0  1.0
1  2.0  1.0
2  2.0  2.0
3  3.0  2.0
4  3.0  NaN
5  NaN  4.0
6  5.0  5.0
------------------------
    A    B
5 NaN  4.0
------------------------
     A   B
4  3.0 NaN
------------------------
     A    B
0  1.0  1.0
1  2.0  1.0
2  2.0  2.0
3  3.0  2.0
4  3.0  NaN
6  5.0  5.0
------------------------
     A    B
0  1.0  1.0
1  2.0  1.0
2  2.0  2.0
3  3.0  2.0
5  NaN  4.0
6  5.0  5.0

pandasについての詳しく知りたい方は書籍もおすすめです。