barilog

エンジニアリング見習い雑記

2019-10-03から1日間の記事一覧

Bigquery上で行う文字列類似度計算 〜Levenshtein Distance〜

名寄せなどを行うために、しばしばlevenshtein distance通称編集距離による類似度比較が行われます。私の場合bigquery上でこの処理を行いたかったのですが探しても探しても該当コードが見あたらなかったため簡単に関数を自作しました。標準SQL文のみだと実装…