オープンデータとプログラミング

データを開く|open data

オープンデータ関連のニュースです。

https://www.biostars.org/t/open%2520data/

日本語

C: 李 yujeong • 0 bowtie2 tophat2 vesion こんにちは ~ ターミナル $ bowtie2 で bowtie2 と bowtie2 パスを入力-bash: bowtie2: コマンドが見つかりません $/pa. C: コピー数変化プロット (R パッケージ) QVINTVS_FABIVS_MAXIMVS • 390 ではこのシーケンス データですか?配列のデータ。マーカーや log2 比率を持っていないまたは B 対立遺伝子 f. C: のコピー番号を変化のプロット (R パッケージ) lee.jingu0626 • 20 アドバイスありがとう。実際に、私は… シーケンス データを持っているので、レアの使い方を説明できますか. A: chrchang523 • 1.4 k Impute2 Impute2 .map ファイルは、https://mathgen.stats.ox.ac.uk から取得することができる組換え地図ファイルを予期して.
続きを読む…

English

C: bowtie2 tophat2 vesion by Lee yujeong • 0 hi~ type bowtie2 and bowtie2 path in terminal $ bowtie2 -bash: bowtie2: command not found $ /pa… C: Copy number variation plot (R package) by QVINTVS_FABIVS_MAXIMVS • 390 How is this sequencing data? It’s array data. You don’t have markers or log2 Ratios or B allele f… C: Copy number variation plot (R package) by lee.jingu0626 • 20 Thanks for your advice. Actually, I have a sequencing data…so, can you explain the usage of rea… A: .map file for Impute2 by chrchang523 • 1.4k Impute2 expects a recombination map file which you can obtain from https://mathgen.stats.ox.ac.uk…
Read more…

法的技術課題を明らかにしました。|Legal tech challenges revealed

オープンデータ関連のニュースです。

http://www.australasianlawyer.com.au/news/legal-tech-challenges-revealed-203890.aspx

日本語

なんと 3 つの実務家は、彼らの組織のレベルのシステム統合を懸念しました。データのセキュリティが入って 5 番目として 5 位を影響を与える法律事務所、後ろにクラウド ベースの技術、モバイル技術と電子譲渡最高技術発行します”。[企業] がすべての技術を変更することによって挑戦されています。「技術をクラウドへの急速な移行がある”と述べた GlobalX 法的最高経営責任者ピーター ・ マロニー。さらにもっと急速な法的セクターの非常に独特ながデータを開く拠点とデータの対話型の機能を有効にするシステムに向けてラッシュ.”マロニー、に従ってすべての企業は、技術の変化に適応するを行うことができますが、彼はプロセスが進行中である是認します。
続きを読む…

English

A whopping one in three practitioners were concerned about their organisation’s level of system integration.Data security came in at number five, as the fifth highest technology issue affecting law firms, trailing behind cloud based technologies, mobile technology and electronic conveyancing.“[Firms] are all being challenged by changing technology; there is a rapid migration to cloud technology,” said GlobalX Legal CEO, Peter Maloney.“Even more rapid, and its very distinctive in the legal sector, is the rush towards open data bases and systems that enable the interactive ability of data.”According to Maloney, all firms could do more to adapt to changing technologies, but he admits that the process is ongoing.
Read more…

【備忘録】「error: no lapack/blas resources found」が出てしまったら・・・

python

備忘メモです。

BLAS、LAPACK、ATLASがインストールされていない、ってことです。
これらのインストール方法はscipyのサイトに詳細がかかれています。

http://www.scipy.org/scipylib/building/windows.html

しかし、CとFortran 77のコンパイラが必要とある。
VCは入っているのでよいとしても、Fortran 77は面倒だ。

そのような人向けにちゃんとありました!sourceforgeにバイナリが・・・
しかも、Winのインストーラ付なので簡単にscipyがインストールできました(BLASやLAPACK、ATLASも)

バージョンは、2015.8.10時点で最新版の0.16.0です。

http://sourceforge.net/projects/scipy/files/scipy/0.16.0/

Python 2.7用と3.X用が分かれていますので、ご注意ください!

easy_install のアップデートで「Permission denied」がでたときの対処方法

python

こんにちは。

pythonのパッケージ管理ソフト「easy_install」を使用している方も多いかと思います。
あまりeasy_installをアップデートする機会は多くありませんが、インストールするパッケージによっては新しいeasy_installが必要となる場合があります。

easy_install自身のアップデートができない!?

easy_installじたいをアップグデートするには、次のようにタイプします。

easy_install -U setuptools

しかし、簡単にはいきません。このコマンドはアクセスが拒否されたといわれて、無情にも終了します。

error: C:\Python27\Scripts\easy_install.exe: Permission denied

理由は簡単で、あなたがたった今、実行中のeasy_install.exeを更新しようとしているためです。

解決方法

それでは解決方法です。

実行中のコマンドを上書きできないだけなので、「C:\Python27\Scripts\」配下にあるeasy_install.exeなど、easy_install****で始まるファイル一式を適当なフォルダ(c:\tempなど)にコピーして、コピーを実行すればOKです。

このとき、easy_install.exeのアイコンに盾マークが付いていたらファイルを右クリックして「互換性」タブを表示します。
「管理者としてこのプログラムを実行する」にチェックを入れて、OKボタンを押下します。

easy_install

ここまでできたら、コマンドプロンプトからc:\tempにコピーしたeasy_install.exeコマンドを実行します。

easy_install -U setuptools

これで無事easy_install.exeがアップデートされるはずです。

これは簡単!ディープラーニングのライブラリ(chainer)をインストール

screenshot
 

こんにちは。

機械学習のアルゴリズムとして、最近はディープラーニング(Deep Learning)が話題になっているので少しいじってみることにしました。
Python用のライブラリを物色していると、chainerというライブラリが良さそうです。
#機能や使い勝手の確認はこれからですが、とにかくインストールが簡単そうです (^^;

必要なパッケージ

githubの説明を見てみると最低限必要なものは以下のとおりです。

  • Python 2.7+, 3.4+
  • NumPy
  • Six 1.9+

 
 
 

これなら、Sixだけバージョン1.9にアップデートすればイケそうです。(もともと1.7はインストール済み)
Sixは、Python 2.xと3.xの差異を吸収するための互換ライブラリで、Sixはバージョン間の差異を吸収するためのユーティリティ関数を提供します。


pip uninstall six    //古いsixをアンインストール
pip install six      //最新のsixをインストール

インストール

次にchainerをインストールします。

pip install chainer

続けてMNISTの手書きデータを認識させるサンプルを実行してみます。
ちなみに、MNISTとは70000サンプルの数字の手書き画像データです。個々の手書き数字データは、28×28ピクセルからなり、各ピクセルは0から255の値を取ります。
機械学習の研究用のデータとしてよく利用されているデータセットです。

では、まずはgithubからwgetを使ってサンプルコードをダウンロード。

wget --no-check-certificate https://github.com/pfnet/chainer/archive/v1.1.2.tar.gz

証明書の検証が正しくできなかったので”–no-check-certificate”オプションを付けました。

ダウンロードしたファイルを解凍します。

tar xzf v1.1.2.tar.gz
python chainer-1.1.2/examples/mnist/train_mnist.py

実行すると次のように訓練とテストが繰り返されていきます。

load MNIST dataset
Downloading train-images-idx3-ubyte.gz...
Done
Downloading train-labels-idx1-ubyte.gz...
Done
Downloading t10k-images-idx3-ubyte.gz...
Done
Downloading t10k-labels-idx1-ubyte.gz...
Done
Converting training data...
Done
Converting test data...
Done
Save output...
Done
Convert completed
('epoch', 1)
graph generated
train mean loss=0.279352151516, accuracy=0.913850001084
test  mean loss=0.121526297252, accuracy=0.963000004292
('epoch', 2)
train mean loss=0.139287877449, accuracy=0.957866669993
test  mean loss=0.0862284902227, accuracy=0.973300007582

<<省略>>

('epoch', 20)
train mean loss=0.0446550305256, accuracy=0.987416676482
test  mean loss=0.0657925747195, accuracy=0.982500008345

インストールまでは簡単でしたね。

サンプルを動かしてみる

続いてword2vecのサンプルを動かしてみます。

C:\temp\chainer-1.1.2\examples\ptb>ls
README.md  download.py  train_ptb.py
C:\temp\chainer-1.1.2\examples\ptb>python download.py
C:\temp\chainer-1.1.2\examples\ptb>ls
README.md    ptb.test.txt   ptb.valid.txt
download.py  ptb.train.txt  train_ptb.py

ptb.test.txt、ptb.valid.txt、ptb.train.txtの3つのファイルができます。

ptb.train.txtを、chainer-1.1.2\examples\word2vecは以下に置きます。

train_word2vec.pyを実行します。

python train_word2vec.py

この処理はかなり時間がかかります。

終了するとモデルのファイル(model.pickle)ができています。

search.pyを実行します。
プロンプトにワードを入れると関連する語が表示されます。
ibmと入力してみます。

python search.py
>> ibm
query: ibm
computer: 0.458478599787
software: 0.446164906025
mainframe: 0.416040301323
computers: 0.409894824028
aborted: 0.399061322212
>>

関連書籍

ワシントンで 開くデータ センターに Bitcoin サービス HashingSpace|Bitcoin service HashingSpace to open data center in Washington

オープンデータ関連のニュースです。

https://99bitcoins.com/bitcoin-service-hashingspace-to-open-data-center-in-washington/

日本語

ASIC と鉱山のホスティング会社、HashingSpace 株式会社は、よく知られている bitcoin オフにワシントンの要塞 1 つのデータ センターを構築します。この会社 bitcoin と、blockchain を採用する世界中で貢献したいです。 これはこの会社から最初のデータ センターではない、それは間違いなく最後の 1 つではありません。HashingSpace は Atm および bitcoin マイニング サーバー卸売サービスを提供します。今後のデータ センターは、高度な機能を備えたモダンなされる予定です。ロス ・ Baruzzini、米国で最高の建築会社の一つによって構築されます。この会社では、6 年間、lat のエンジニア リングおよび設計サービスを提供しています。
続きを読む…

English

A well-known bitcoin ASIC mining and hosting firm, HashingSpace Corporation has made it clear that they will be building Fortress One Data Center in Washington. This company wants to contribute in making the whole world adopt bitcoin and the blockchain. This is not the first data center from this firm and it’s definitely not the last one. HashingSpace has ATMs and bitcoin mining servers that offer wholesale services. The upcoming data center is expected to be modern with advanced features. It will be built by Ross & Baruzzini, one of the best architectural companies in the US. This company has been offering engineering and designing services in the lat six decades.
Read more…

Hackathon@SG は、現実の課題に革新的なソリューションを生成します。|Hackathon@SG produces innovative solutions to real-life challenges

オープンデータ関連のニュースです。

http://enterpriseinnovation.net/article/hackathonsg-produces-innovative-solutions-real-life-challenges-2025320478

日本語

300 人以上のプロトタイプとスマート国家の課題を解決するためにアプリケーションは、Hackathon@SG と共存して MIT のハッキング Medicine@SG (HackMed) の間に開発されました。 初めてのシンガポールで開催された、イベントは、医療従事者、起業家、プログラマ、デザイナー、学生などすべての人生の歩みからの 1,100 以上の大規模な投票を見た。 ソリューションの例をいくつか摂取ロボット無人機の商業活動を規制する GPS ベースの価格設定システムの健康を改善してもスマート生活のソリューションとリモートのエンターテイメントに焦点を当ててコントロール デバイス自宅。
続きを読む…

English

More than 300 prototypes and applications to help solve Smart Nation challenges were developed during the Hackathon@SG and the co-located MIT Hacking Medicine@SG (HackMed).  Held in Singapore for the first time, the event saw a massive turnout of over 1,100 from all walks of life such as healthcare professionals, entrepreneurs, programmers, designers, and students. Some examples of solutions included ingestible robots to improve health, a GPS-based pricing system to regulate commercial drone activities and even a smart living solution that focuses on entertainment and remotely controls devices at home.
Read more…

ウガンダの Mozilla 祭日のボーダフォンを支払う|Vodafone pays for Mozilla fete in Uganda

オープンデータ関連のニュースです。

http://www.busiweek.com/index1.php%3FCtp%3D2%26pI%3D3853%26pLv%3D3%26srI%3D69%26spI%3D221%26cI%3D11

日本語

カンパラ、ウガンダの東アフリカの様々 な大学からの留学生は、オープン教育とデジタル知識を改善する方法としてデジタル リテラシーを包含し、学習の方法を簡素化するお勧めされています。 今後数年間の学校教育システムは完全に変更、本で時代遅れにされるほとんどの機関とオンライン学習に必要なすべて発見されます。 ボーダフォン (ウガンダ) 最高技術責任者デリック Sebbaale はビクトリア大学カンパラで開催された Mozilla 祭で最近話していた。ボーダフォンは、英国に拠点を置くが、最近ウガンダの操作をセットアップします。 「デジタル リテラシーは今日の現実です。私たちが住む場所についてはほとんど何も、すべてをオンライン見つけることができる時代。
続きを読む…

English

KAMPALA, Uganda – Students from various universities across East Africa have been advised to embrace open education and digital literacy as way of improving their digital knowledge and simplify ways of learning. In the coming years, school systems will completely change, books will be outdated in most institutions as everything needed for learning will be found online. Vodafone (Uganda) Chief Technical Officer Derrick Sebbaale was recently speaking at the Mozilla Festival which took place at Victoria University in Kampala. Vodafone is based in the UK, but recently set up operations in Uganda. “Digital literacy is today’s reality. We live in an era where information about almost anything and everything can be found online.
Read more…

都市: コミュニティの透明性を高めるフォート コリンズ データを開く|In the city: Fort Collins opening data to increase community transparency

オープンデータ関連のニュースです。

http://www.coloradoan.com/story/news/2015/08/09/city-fort-collins-opening-data-increase-community-transparency/31391863/

日本語

市議会の優先順位設定後退この春、中にそれはオープン データ プログラムを開発スタッフに尋ねた。私たちの最高情報責任者、ダン Coldiron、チャンスに飛びついたし、フォート ・ コリンズ”OpenCity”と呼ばれるの新しいイニシアチブの開発は フォートコリンズの街は、透明性とコミュニティの関与を値です。組織は、開かれた本アプリケーションから弊社の費用の記録をオンラインで使用できるように、かなり大胆な動きで 2009 年にこれらの値を示した。たように何を期待するすべてのあなたの友人や近所の人まであなたの小切手帳を開くようなもののようです。 今日では、透明性への期待がも大きいです。市では、政府の開放性と透明性次世代で興奮しています。
続きを読む…

English

During City Council’s priority-setting retreat this spring, it asked staff to develop an open data program. Our chief information officer, Dan Coldiron, jumped at the chance and is developing a new initiative in Fort Collins called “OpenCity.” The city of Fort Collins values transparency and community engagement. The organization demonstrated those values in 2009 with a fairly bold move, making our expense records available online through our Open Book application. We weren’t sure what to expect, because it was sort of like opening your checkbook up to all of your friends and neighbors. Today, the expectations for transparency are even greater. At the city, we’re excited by the next generation of transparency and openness in government.
Read more…

データ法の次は何?|What’s Next for the DATA Act?

オープンデータ関連のニュースです。

http://www.socrata.com/blog/whats-next-data-act/

日本語

2014 年のデータの行為は大きな一歩の前進が成功、今後の締め切り満たされる必要があるおよび実装中に監視の詳細を本当に法律の順序で政府の説明責任と透明性のためだった ホワイトハウス当局者は 2015 年 5 月に初期データ規格をリリース、夏の追加要素が伝わって来た。連邦政府機関は、実装計画を策定し、コストや更新新しいガイドラインを満たすために既存のプロセスに必要なリソースの見積もりを続けています。 2016年 11 月-わずか数日のアメリカ人が彼らの次の大統領を選択後、各連邦政府機関の査察官はその支出データの量と質に最初のレポートを公開する必要があります。機関が送信されます 2 つのフォロー アップ レポート今後の年。
続きを読む…

English

The DATA Act of 2014 was a huge step forward for government accountability and transparency, but in order for the law to truly be a success, upcoming deadlines need to be met and details monitored during its implementation. White House officials released initial data standards in May 2015 and additional elements have trickled out throughout the summer. Federal agencies are continuing to develop implementation plans and estimate costs and resources needed to update existing processes to meet the new guidelines. In November 2016 — only days after Americans select their next president — the inspector general for each federal agency will be required to publish an initial report on the quality and quantity of its spending data. Agencies will submit two follow-up reports in future years.
Read more…