2018年6月 – IT研究所

AWSのlambdaはサーバレスアーキテクチャで非常に扱いがいいのですが、一つ難点があって、アップロードできるファイルサイズが限られていることです。
最大50MのZIPファイルまでなのですが、裏技を使って展開時に500M以上のファイルを使うことができます。

そのカラクリは、Lambdaの/tmp以下は500Mまで使うことができます。この領域に、Lambdaが起動するときにファイルをS3から読み込めば、非常に大きなライブラリが必要なプログラムも動かすことができます。
以下は、pythonにてkeras+tensorflow+opencvを動かすサンプルです。

ライブラリ準備

python3を使用します。
ライブラリは、あらかじめ、EC2でAmazonLinuxを使って作成しておきます。

requirements.txt

keras
opencv-python
tensorflow
numpy

keras

opencv-python

tensorflow

numpy

mkdir lib
pip3 install -U -r requirements.txt -t lib

1 2	mkdir lib pip3 install -U -r requirements.txt -t lib

このlib以下にライブラリがインストールされます。

find lib -name "*.pyc" -exec rm -rf {} ¥;

1	find lib -name "*.pyc" -exec rm -rf {} ¥;

pycは削除しておきます。しなくてもいいですが。。。

これを全てLambdaの起動時に追加してもいいのですが、ロードが面倒になるので２つに分けます。

mv lib lib_other
mkdir lib
cd lib_other
mv cv2* ../lib
mv h5py* ../lib
mv keras* ../lib
mv tensor* ../lib
cd ..

mv lib lib_other

mkdir lib

cd lib_other

mv cv2* ../lib

mv h5py* ../lib

mv keras* ../lib

mv tensor* ../lib

cd ..

libを固めてS3にアップ

zip -r lib.zip lib
aws s3 cp s3://bucketname/

1 2	zip -r lib.zip lib aws s3 cp s3://bucketname/

lambdaディレクトリ

lambda用のディレクトリに、先ほど分けたlib_otherのライブラリを入れておきます。
これ全部を入れてようやく５０Mぐらいまでに収まります。

mkdir lambda_dir
cd lambda_dir
mkdir vendor
cd vendor
cp -pr ../../lib_other/* .

mkdir lambda_dir

cd lambda_dir

mkdir vendor

cd vendor

cp -pr ../../lib_other/* .

lambdaプログラム

lambdaのプログラムには少し工夫が必要です。
起動時に、S3から先ほどアップしたlib.zipをダウンロードし展開、ロードします。

lambda_functioy.py


import sys
import os
sys.path.append(os.path.join(os.path.abspath(os.path.dirname(__file__)), './vendor'))

import boto3
import zipfile
import importlib

def lambda_handler(event, context):
    s3 = boto3.resource("s3")

    def load_zip(file):
        print("load_zip:"+file)
        s3.Bucket(bucket_name).download_file(libfiledir+"/"+file,"/tmp/"+file)
        with zipfile.ZipFile("/tmp/"+file) as zip:
            zip.extractall("/tmp")
        os.remove("/tmp/"+file)

    if os.path.exists("/tmp/lib") is False:  # 2回目以降はスキップ
        load_zip("lib.zip")

    sys.path.append('/tmp/lib')
    importlib.import_module("numpy")
    importlib.import_module("scipy")
    importlib.import_module("six")
    importlib.import_module("yaml")
    importlib.import_module("enum")
    importlib.import_module("h5py")
    importlib.import_module("absl")
    importlib.import_module("astor")
    importlib.import_module("bleach")
    importlib.import_module("external")
    importlib.import_module("gast")
    importlib.import_module("google.protobuf")
    importlib.import_module("grpc")
    importlib.import_module("html5lib")
    importlib.import_module("markdown")
    importlib.import_module("werkzeug")
    importlib.import_module("wheel")
    importlib.import_module("cv2")
    importlib.import_module("tensorflow")
    importlib.import_module("keras")

    import cv2
    import keras
    import numpy as np

import sys

import os

sys.path.append(os.path.join(os.path.abspath(os.path.dirname(__file__)), './vendor'))

import boto3

import zipfile

import importlib

def lambda_handler(event, context):

s3 = boto3.resource("s3")

def load_zip(file):

print("load_zip:"+file)

s3.Bucket(bucket_name).download_file(libfiledir+"/"+file,"/tmp/"+file)

with zipfile.ZipFile("/tmp/"+file) as zip:

zip.extractall("/tmp")

os.remove("/tmp/"+file)

if os.path.exists("/tmp/lib") is False: # 2回目以降はスキップ

load_zip("lib.zip")

sys.path.append('/tmp/lib')

importlib.import_module("numpy")

importlib.import_module("scipy")

importlib.import_module("six")

importlib.import_module("yaml")

importlib.import_module("enum")

importlib.import_module("h5py")

importlib.import_module("absl")

importlib.import_module("astor")

importlib.import_module("bleach")

importlib.import_module("external")

importlib.import_module("gast")

importlib.import_module("google.protobuf")

importlib.import_module("grpc")

importlib.import_module("html5lib")

importlib.import_module("markdown")

importlib.import_module("werkzeug")

importlib.import_module("wheel")

importlib.import_module("cv2")

importlib.import_module("tensorflow")

importlib.import_module("keras")

import cv2

import keras

import numpy as np

こんな感じでコードを書きます。
Lambdaは一度起動すると、しばらくはインスタンスが残っているので、２回目以降に再度S3からダウンロードするのを防ぎます。

こんな感じで、５００M以上のモジュールをつかったLambdaファンクションが作ることができます。

複数出力の回帰をKerasで行います。

通常、回帰分析は複数の説明変数に一つの目的変数なのですが、これは、複数の目的変数を取ることができます。
multivariateとmultivariableの違いはこのあたりを参照のこと。

コードはこちらを参考にこんな感じ。


import numpy as np
from keras.layers import Dense,Activation
from keras.models import Sequential
model = Sequential()
model.add(Dense(16, input_shape=(1,)))
model.add(Activation('relu'))
model.add(Dense(16, input_shape=(1,)))
model.add(Activation('relu'))
model.add(Dense(2))
model.compile(loss='mean_squared_error', optimizer='Adam')


inputs = np.zeros((10, 1), dtype=np.float32)
targets = np.zeros((10, 2), dtype=np.float32)

for i in range(10):
    inputs[i] = i / 10.0
    targets[i, 0] = 1.0-0.1 * i / 2.0
    targets[i, 1] = 0.01 * i

model.fit(inputs,targets,epochs=200,batch_size=5)

print(targets)
print(model.predict(inputs))

import numpy as np

from keras.layers import Dense,Activation

from keras.models import Sequential

model = Sequential()

model.add(Dense(16, input_shape=(1,)))

model.add(Activation('relu'))

model.add(Dense(16, input_shape=(1,)))

model.add(Activation('relu'))

model.add(Dense(2))

model.compile(loss='mean_squared_error', optimizer='Adam')

inputs = np.zeros((10, 1), dtype=np.float32)

targets = np.zeros((10, 2), dtype=np.float32)

for i in range(10):

inputs[i] = i / 10.0

targets[i, 0] = 1.0-0.1 * i / 2.0

targets[i, 1] = 0.01 * i

model.fit(inputs,targets,epochs=200,batch_size=5)

print(targets)

print(model.predict(inputs))

結果

[[1.   0.  ]
 [0.95 0.01]
 [0.9  0.02]
 [0.85 0.03]
 [0.8  0.04]
 [0.75 0.05]
 [0.7  0.06]
 [0.65 0.07]
 [0.6  0.08]
 [0.55 0.09]]
[[0.88971126 0.00797045]
 [0.9289691  0.02162787]
 [0.8843044  0.02890772]
 [0.8396398  0.03618753]
 [0.7949753  0.04346737]
 [0.7503106  0.0507472 ]
 [0.70564604 0.058027  ]
 [0.6609814  0.06530684]
 [0.61631685 0.07258669]
 [0.57165223 0.0798665 ]]

[[1. 0. ]

[0.95 0.01]

[0.9 0.02]

[0.85 0.03]

[0.8 0.04]

[0.75 0.05]

[0.7 0.06]

[0.65 0.07]

[0.6 0.08]

[0.55 0.09]]

[[0.88971126 0.00797045]

[0.9289691 0.02162787]

[0.8843044 0.02890772]

[0.8396398 0.03618753]

[0.7949753 0.04346737]

[0.7503106 0.0507472 ]

[0.70564604 0.058027 ]

[0.6609814 0.06530684]

[0.61631685 0.07258669]

[0.57165223 0.0798665 ]]

ちゃんと学習できているようです

Just another 靱技術士事務所 site

月別: 2018年6月

AWSlambdaでkerasを動かす

ライブラリ準備

lambdaディレクトリ

lambdaプログラム

multivariate regressionをkerasで