オープンデータとプログラミング

ウィプロは、オープン データ センター-卓越性の中心を起動します。|Wipro Launches Open Data Center – Centre of Excellence

オープンデータ関連のニュースです。

http://computer.financialexpress.com/news/wipro-launches-open-data-center-centre-of-excellence/13191/

日本語

ウィプロのオープン データ センター-CoE ネットワーク、ストレージ、コンピューティングおよびクラウドを含むすべてのレイヤーにわたってプロプライエタリとオープン ソースのソリューションを統合します。 ウィプロ ‘ソフトウェア定義基盤’ (SDI) の基になるテーマとその親切なオープン データ センター-エクセレンス センター (CoE) の最初に開始しました。 ウィプロのオープン データ センター-CoE ネットワーク、ストレージ、コンピューティングおよびクラウドを含むすべてのレイヤーにわたってプロプライエタリとオープン ソースのソリューションを統合します。卓越性のセンターを目指しているクライアント データ センターを変えるウィプロの採用フレームワークを活用インフラ自動化アプリケーション移行の方法論やツール アクセラレータ ウィプロ IP 資産から成る。CoE は、オープン スタック フレームワークなどの新分野でウィプロの多大な投資からも描画します。
続きを読む…

English

Wipro’s Open Data Center – CoE integrates proprietary and Open Source solutions across all layers including Network, Storage, Compute and Cloud. Wipro launched a first of its kind Open Data Center – Centre of Excellence (CoE) with the underlying theme of ‘Software Defined Infrastructure’ (SDI). Wipro’s Open Data Center – CoE integrates proprietary and Open Source solutions across all layers including Network, Storage, Compute and Cloud. The Centre of Excellence is aimed at transforming client Data Centers leveraging Wipro’s Adoption Framework, comprising of Wipro IP assets including accelerators, tools, migration methodologies and infrastructure automation applications. The CoE also draws from Wipro’s significant investments in emerging areas such as Open Stack framework.
Read more…

ウィプロは、SDI オープン データ センター CoE をビルドします。|Wipro builds SDI Open Data Centre CoE

オープンデータ関連のニュースです。

http://www.cbronline.com/news/data-centre/infrastructure/wipro-builds-sdi-open-data-centre-coe-4650236

日本語

サービス プロバイダー ウィプロは、ソフトウェア インフラストラクチャ (SDI) とオープン データ センター – エクセレンス センター (CoE) 今週慣れる企業を支援するを開始しました。 施設ネットワーク、ストレージ、コンピューティングおよびクラウドを含むすべてのレイヤーにわたってプロプライエタリとオープン ソースのソリューションを統合するといいます。 当事務所は、レガシ システムと SDI ソリューション間の相互運用性が可能であることをお客様に示すことだと述べた。 SDI によりクラウド ・ コンピューティング ・ リソースを自動的に管理、ソフトウェアによって制御、インテルによるとデータ センターの人間のタスクの必要性を削減します。
続きを読む…

English

Services provider Wipro has launched an Open Data Centre – Centre of Excellence (CoE) this week to help enterprises familiarise themselves with software defined infrastructure (SDI). The company said the facility integrates proprietary and open source solutions across all layers including network, storage, compute and cloud. The firm said it wants to show customers that interoperability between legacy systems and SDI solutions is possible. SDI allows cloud computing resources to be automatically managed and controlled by software, reducing the need for human tasks in the data centre, according to Intel.
Read more…

$ 10 億雲プッシュの中でシンガポールでは、開いているデータ センターにアリババ|Alibaba to open data center in Singapore, amid $1 billion cloud push

オープンデータ関連のニュースです。

http://www.pcworld.com/article/2972985/alibaba-to-open-data-center-in-singapore-amid-1-billion-cloud-push.html

日本語

アリババ グループのクラウド事業は、この 9 月にシンガポールでオンライン行きます新しいデータ センターを持つ東南アジア市場を狙っています。 シンガポールの施設は、アリババの 2 番目のデータ センターは、中国外です。同社は、クラウド コンピューティング、米国を含む国際市場を視野に積極的に推進しています。 先月、アリババは、それらの努力を高速化する米国 $ 10 億の投資を発表しました。他のデータ センターは、ヨーロッパ、日本、中東に計画されています。 シンガポールの施設はアリババの国際クラウド事業本部ともなります。 新しいデータ センターは東南アジアの顧客をターゲットが買収した誘致中国の顧客優先順位。
続きを読む…

English

Alibaba Group’s cloud business is targeting the Southeast Asian market with a new data center that will go online in Singapore this September. The Singapore facility is Alibaba’s second data center built outside China. The company has been pushing aggressively into cloud computing, with an eye toward international markets, including the U.S. Last month, Alibaba announced a US$1 billion investment to speed up those efforts. Other data centers are being planned for Europe, Japan, and the Middle East. As for the Singapore facility, it will also serve as Alibaba’s headquarters for its international cloud business. Although the new data center will target customers in Southeast Asia, the company has made attracting Chinese clients a priority.
Read more…

シンガポールにおける データ センターにアリババ|Alibaba to open data center in Singapore

オープンデータ関連のニュースです。

http://news.xinhuanet.com/english/2015-08/19/c_134534828.htm

日本語

シンガポール、8 月 19 日 (新華社) ― ― 中国の電子商取引大手アリババ グループ水曜日と述べたことでそれが開くデータ センター来月シンガポール、Aliyun、クラウド ・ コンピューティングの腕で今年、発売を 2 番目の海外データベース。 アリババは、センターはクラウドコンピューティング中国ビジネスに初期を中心とした東南アジアの企業の皆様にサービスの範囲を提供すると述べた。9 月に開くとき新しいセンターが北京、杭州、青島、Hong Kong、深セン、シリコン バレーで既存の六つのセンターと接続して、それを追加しました。 アリババはまたシンガポールになります Aliyun の海外事業本部と述べた。
続きを読む…

English

SINGAPORE, Aug. 19 (Xinhua) — China’s e-commerce giant Alibaba Group said on Wednesday that it will open a data center next month in Singapore, the second overseas database to be launched this year by Aliyun, its cloud computing arm. Alibaba said the center will provide a range of cloud computing services to companies operating in Southeast Asia, with an initial focus on Chinese businesses. The new center will be connected with the existing six centers in Beijing, Hangzhou, Qingdao, Hong Kong, Shenzhen and Silicon Valley when it opens in September, it added. Alibaba also said Singapore will be the headquarters for Aliyun ‘s overseas operations.
Read more…

レイ システム オープン ソース GovDashboard ツール|REI Systems Open Sources GovDashboard Tool

オープンデータ関連のニュースです。

http://www.itnewsonline.com/prnewswire/REI-Systems-Open-Sources-GovDashboard-Tool/392290

日本語

スターリング、バージニア州、2015 年 8 月 19 日日/prnewswire/- 綾波システム (レイ) リリース発表した今日、オープンの GovDashboard 製品を供給して GitHub に介してツールのソース コード。 レイは、Performance.gov や ITDashboard.gov など米国の連邦政府によって委託公共部門の透明性ダッシュ ボードの最も強力な機能を組み込むための GovDashboard を構築しました。 人気のある機能データ、ダッシュ ボードの構築、およびデータ ソース変更として頻繁に更新されるコンテンツを含むデータ テーブルと視覚エフェクト、テキスト、写真、およびその他のオブジェクトを組み込むことができますカスタマイズ ツールを視覚化するユーザーフレンドリーなインターフェイス、1 ダースの標準的な方法があります。 GovDashboard 力公開されているウェブサイトなど FDA データ ダッシュ ボード (http://govdashboard.fda。
続きを読む…

English

STERLING, Va., Aug. 19, 2015 /PRNewswire/ — REI Systems (REI) announced today that has open sourced its GovDashboard product, releasing source code for the tool via GitHub. REI built GovDashboard to incorporate the strongest features of public sector transparency dashboards commissioned by the U.S. Federal Government such as Performance.gov and ITDashboard.gov.  Popular features include a user-friendly interface, a dozen standard ways to visualize data, dashboard building, and customization tools that can incorporate data tables and visualizations, text, photos, and other objects, with content updated as frequently as data sources change. GovDashboard powers publicly visible websites such as FDA Data Dashboard (http://govdashboard.fda.
Read more…

ウィプロは、米国、インドでショールームのデータ センターを開きます|Wipro opens showroom data centers in the US, India

オープンデータ関連のニュースです。

http://www.datacenterdynamics.com/design-strategy/wipro-opens-showroom-data-centers-in-the-us-india/94653.article

日本語

センターオブエクセレンスの新しいソフトウェア定義技術大手ウィプロは、マウンテン ビュー、米国とインドのバンガロールにある開いているデータ センター技術の卓越性の 2 つセンターを開始したインドの IT サービスが披露されます。 センター独自のネットワー キング、ストレージ、コンピューティングのためのオープン ソース ソリューションを紹介ソフトウェア定義インフラストラクチャ (SDI) に焦点を当てます。 ウィプロは、アクションで新しい技術、ツールと新しいハードウェアにより容易な移行を可能にするサービスを含むウィプロの採用フレームワークを使用して独自のデータ センターの近代化を顧客に納得させる見て期待しています。 卓越性の新しいセンターは、昨年発表したオープン ソース技術の広い投資の一部です。
続きを読む…

English

The new Centers of Excellence will showcase software-defined technologies Indian IT services giant Wipro has launched two Centers of Excellence for open data center technologies, located in Mountain View, USA and Bangalore, India. The centers will focus on software-defined infrastructure (SDI), showcasing proprietary and Open Source solutions for networking, storage and compute. Wipro hopes seeing new technology in action will convince customers to modernize their own data centers using Wipro’s Adoption Framework, which includes tools and services to enable easier migration to new hardware. The new Centers of Excellence are a part of a wider investment in open source technologies announced last year.
Read more…

スコットランドを与える データを開く プッシュ|Scotland gives open data a push

オープンデータ関連のニュースです。

http://www.ukauthority.com/news/5568/scotland-gives-open-data-a-push

日本語

UKAuthority.com には、クッキーの使用が必要です。このサイトの継続的な使用は、このポリシーに同意することを示します。 ICO の EU e プライバシー指令に従い、お客様のプライバシーを保護するためにこのサイトに cookie の使用を認識して私たちは、こと。 我々 は当社のウェブサイトの維持・向上を支援するためにこれらを使用します。クッキーは、機能と Google アナリティクスの主にこのサイトに訪問者の行動を追跡するために使用されます。 Google 社は、米国の安全な港スキームのメンバーです。このスキームには、EEA 内から特定のデータ転送契約を締結することがなく、EEA 外の国へのデータの転送が可能します。スキームにサインアップする企業は、ヨーロッパから送受信される個人情報の適切な保護を提供するとみなされます。
続きを読む…

English

UKAuthority.com requires the use of cookies. Continued use of this site indicates that you accept this policy. In accordance with the ICO’s EU e-Privacy Directive and to help protect your privacy we are making you aware of the use of cookies on this site. We use these to aid in improving and maintaining our website. Cookies are used for functionality and to track visitor behaviour on this site, primarily for Google Analytics. Google Inc are members of the US Safe Harbor Scheme. This scheme allows the transfer of data from within the EEA to countries that are outside of the EEA without having to enter into a specific data transfer agreement. Companies that sign up to the scheme are deemed to provide adequate protection for personal data transmitted from Europe.
Read more…

専門家: イギリス行くそれを得るために年を取った|Expert: Britain took years to get it going

オープンデータ関連のニュースです。

http://www.thestar.com.my/News/Nation/2015/08/20/Open-data-move-will-take-time-Expert-Britain-took-years-to-get-it-going/

日本語

イギリスのオープン データ ポータルの頭のクアラルンプール: マレーシアの移動データを開く社会になる長い不倫になりますが、それは可能と考えています。 イギリスのオープン データ ポータル Data.gov.uk を率いるアントニア · アクーニャ (pic) は、イギリスもなるだけでなく、市民より良い情報に基づいた、オープン データ社会の創造に向けて動いていたが、政府と国民のより良い意思決定を行うと述べた。 開閉を信じたデータは政府が国民とその情報を共有できる社会を変えることができます。 「我々 は政府の受動の受信機になって停止したりし、共同主人公になることを始める」とのインタビューで述べた。 彼は、警察の例です。
続きを読む…

English

KUALA LUMPUR: The head of a British open data portal believes that Malaysia’s move to become an open data society will be a lengthy affair, but it is feasible. Antonia Acuna (pic), who heads the British open data portal Data.gov.uk, said Britain was also moving towards the creation of an open data society, which will not only make its citizens better informed, but help the Government and people make better decisions. He believed that open data could change society, where the Govern­ment can share its information with the public. “We stop becoming passive receivers of government and start becoming co-protagonists,” he said in an interview. He gave an example in the police.
Read more…

Pythonの本文抽出ライブラリreadabilityのインストール(備忘録)

python

HTMLから本文を抽出するpythonのライブラリの一つにreadabilityがあります。
readabilityはpipでインストールすることができます。

pip install readability-lxml

コマンドラインから実行することができます。日本語のページから抽出可能か、国立国会図書館のページで試してみます。

python -m readability.readability -u http://www.ndl.go.jp/jp/service/index.html
Title:サービス概要|国立国会図書館―National Diet Library
<html><body><div><div class="mainbody">&#13;
&#13;
&#13;
<h2>サービス概要</h2>&#13;
&#13;
&#13;
&#13;
<h3 id="anchor01">当館のサービス</h3>&#13;
<div class="dataSet">&#13;
&#13;
&#13;
&#13;
<p>国立国会図書館は、東京本館、関西館、国際子ども図書館の三つの施設で、資料の閲覧や複写などの来館利
用サービスを行っています。また、インターネット経由の資料の複写申込など、来館しないで利用できるサービ
スも行っています。</p>&#13;


<<以下省略>>

うまくいきました!

pythonのコードならこんな感じになります。
とてもシンプルですね。

#coding: UTF-8
from readability.readability import Document
import urllib

url = 'http://www.ndl.go.jp/jp/service/index.html'

html = urllib.urlopen(url).read()
readable_article = Document(html).summary()
readable_title = Document(html).short_title()

print readable_article
print readable_title

Pythonの本文抽出ライブラリboilerpipeのインストール(備忘録)

python

HTMLから本文抽出(スクレイピング)をするpythonライブラリの一つにboilerpipeがあります。
boilerpipeはpipでインストールすることができます。

pip install boilerpipe

もし、下記のエラーメッセージが出てしまったら、Microsoft Visual C++ 9.0をインストールしてください。

error: Microsoft Visual C++ 9.0 is required (Unable to find vcvarsall.bat). Get it from http://aka.ms/vcpython27

Microsoft Visual C++ 9.0は、次のURLからダウンロードすることができます。

インストールは無事終わったかにみえましたが、boilerpipeをインストールするとpythonじたいがクラッシュ。

原因不明なので、継続調査です。

ちなみに、Pythonのバージョンは 2.7.2です。

こちらのサイトを見ると、Windows環境はビックリマークが付いています。
https://code.activestate.com/pypm/boilerpipe/

boilerpipeがだめなら、他のライブラリを試すとするか…。ありましたありました、比較サイトが!
Dragnet、Eatiht、Readabilityは初めて知りました。

Benchmarking Python Content Extraction Algorithms: Dragnet, Readability, Goose, and Eatiht
https://moz.com/devblog/benchmarking-python-content-extraction-algorithms-dragnet-readability-goose-and-eatiht/