Rのh2oでエラー対応法

H2Oパッケージを触っていてエラーが出たのでメモ

環境

  • ubuntu14.04
  • R-3.3.1
  • h2o-2.0.1

インストール

まずここを参考にインストールします

cmake

h2o

設定

起動

サンプル

ここのサンプルを実行してみます

ここでエラー発生

どうやら、h2oの仕様が変わったようです。こちらを参考に修正します

またまたエラー

仕様をみると、また変わっていました。以下のように修正します

続けます

これでうまく実行できました

終了

仕様がよく変わるので、メジャーバージョンアップ時は要注意です

Word Cloudを使って見る

WordCloudなるライブラリがあるので使ってみました。
自分の環境ではそのままではちょっとうまく動かなかったのでメモです。

こちらを参考にしました。

環境

– MacOS10.11
– python 2.7.12
– mecab 0.996

インストール

エラー

こちらのサンプルをそのまま実行するとエラーが出ます

HTMLパーサーを明示的に入れます

そのまま実行するとまたまたエラー

どうもUnicodeがらみのエラーです。stop_wordsのUnicode変換がうまくいっていないようなので普通の文字列にします

コード修正

自分の環境に合わせていじります

実行

これで画像が表示されます

CentOS5にbzip2-1.0.6をインストール

未だCentOS5を使っているといろいろと不都合が生じてきます。まず、最新のアプリケーションを使おうとすると、デフォルトで入っているライブラリ群が古く全くインストールできません。

今回はCentOS5.11にbzip2-1.0.6をインストールしてみます

ダウンロード

コンパイル

シェアードライブラリも同時にコンパイルします
まずは本体

次にシェアードライブラリ

ここでエラーが

解決方法

どうもfPICをつけてコンパイルしないとダメなようです
本体側も修正、Makefileを修正します

コンパイル

次にシェアードライブラリ。Makefile-libbz2_soを修正

コンパイル

Rでword2vec

こちらを参考にRでWord2Vecを実行してみたが、ちょっとハマったのでメモ

パッケージインストール

必要なパッケージをインストールします

データ作成

青空文庫から夏目漱石の三四郎をテストデータとします

UTF8へ文字コードを変換しておきます。ちなみにmecabはUTF8のものをインストールしておいてください

R実行

Rから実行します

threadsはCPU数−1あたりで設定します
これを実行すると

このようなエラーが出ます
この場合には気にせずRで

これで読み込み直してやります。

確認

ま、こんなもんです

ubuntu14.04へRの最新版をapt-getでインストール

ubuntu14.04にapt−getでインストールできるRのバージョンは3.0.2とちょっと古いです。
最新版をインストールするには以下のようにします

PROXY環境下の場合には

の環境変数を入れる必要があります

ここを参考にしました

RSRubyの使い方

よく忘れるのでメモ

CentOS5.11へgcc-4.8.5をインストール

たまたま余っていたCentOS5.11のサーバにpython2.7.12をインストールし、pylabをインストールしようとするとエラー。

どうもOSが古いと色々問題があります。

そこでこちらを参考にGCCをインストールします

ダウンロード

以下のサイトからダウンロードします。とりあえず最新版をダウンロードしました。

コンパイル

環境設定

使う際には、環境変数に入れて使い分けます

RでLDA

自分用メモ

こちらのRでLDAのサンプルがありますが、うまく動かなかったので修正メモ

環境

  • MacOS10.11
  • RStudio 0.99.484
  • R version 3.3.0

エラー

こちらのスクリプトを順番に実行していくと

この部分で以下のエラーが出ます

以下のように修正します

次はこのエラーです

ここを参考に修正します

修正スクリプト

まとめ

Rのパッケージは時々仕様が変わってしまいますので自分でコードを修正する必要があります。