barilog

エンジニアリング見習い雑記

2019-01-01から1年間の記事一覧

Bigquery上で行う文字列類似度計算 〜Levenshtein Distance〜

名寄せなどを行うために、しばしばlevenshtein distance通称編集距離による類似度比較が行われます。私の場合bigquery上でこの処理を行いたかったのですが探しても探しても該当コードが見あたらなかったため簡単に関数を自作しました。標準SQL文のみだと実装…

csvファイルからjsonファイルを出力するコード

忘備録:csvファイルからjsonファイルを出力するコード import csv , json csvFilePath = "file.csv" jsonFilePath = "file.json" arr = [] #read the csv and add the arr to a arrayn with open (csvFilePath) as csvFile: csvReader = csv.DictReader(csv…

リモートサーバのubuntuにおいてdockerで日本語自然言語処理環境を構築してjupyterを立ち上げてアクセスする

ubuntuで自然言語処理環境を構築する方法 0.ubuntuインスタンスを作成 今回はGCPでubuntu16.04インスタンスを作成しました. この過程に関しては他のブログをみてください 1.docker CEをインストール https://docs.docker.com/install/linux/docker-ce/ubunt…

ssh接続時にjupyter notebookが403エラーで立ち上がらないときの対処法

jupyter notebookを不正に終了していることが原因ぽいです. github.com の https://github.com/jupyter/notebook/issues/2844#issuecomment-385882596 こちらのコメントに従いましょう.

mysqlのroot userのpassowordを再設定する方法[ubuntu]

linuxconfig.orgこちらにのっとってやること.

SQLのSELECT文で最初と最後のレコードを取り出すクエリ

こんな感じ(select * from market_Ohlc where currency_pair='btcjpy' order by close_time asc limit 1) union all (select * from market_Ohlc where currency_pair='btcjpy' order by close_time desc limit 1);(select 任意のカラム from 任意のテーブル…