オープンデータ関連のニュースです。
日本語
Microsoftは18日、データサイエンティストにとって新しいライブラリを公開したApache Spark上で生産性が向上します。Microsoftの機械学習ライブラリは、実験の速度を増加させることができ、非常に大きなデータセットでの最先端の機械学習技術を活用します。テキスト形式またはカテゴリカルスなどの種々の形式のデータを処理するための簡単で一貫したAPIを提供します。このライブラリを使用すると、データを単にモデルへ通過することが可能であり、ライブラリーは残りを処理します。また、パイプラインを再コーディングしなくても特徴空間とアルゴリズムを簡単に変更することができます。ミルスパークの機能は次のとおりです。
詳細についてはこちら。
続きを読む…
English
Microsoft yesterday released a new library for data scientists to be more productive on Apache Spark. The Microsoft Machine Learning library will increase the rate of experimentation, and leverage cutting-edge machine learning techniques on very large datasets. It provides simplified consistent APIs for handling different types of data such as text or categoricals. With this new library, you can simply pass the data to the model, and the library takes care of the rest. It also allows you to easily change the feature space and algorithm without having to re-code the pipeline.
Read more…