q Text as Data

By | 2015/03/03 8:03 PM

http://harelba.github.io/q/

tsvファイルやcsvファイル等をそのままSQLであれこれしてしまおうという感じ。

ということで面白そうなので使ってみました。

で、rpm取得してインストール

早速使ってみましょう。

コレ、CSVとかで無くても大丈夫見たいなのです。
なので今回はアクセスログをゴニョゴニョしてみます。

で行けるみたいです。

出力結果は、まぁ元のファイルに依存するみたいなのでそれぞれ見ていただければと思います。

オプション
-D
 出力のファイルのデリミタ
 ex)
  -D $’\t’ => TSVファイル
-d
 入力のファイルのデリミタ
 ex)
  -d ,   => CSVファイル
-O
 出力ファイルのヘッダーを出力
-H
 入力ファイルのヘッダーをカラム名として利用
-e
 入力ファイルの文字エンコーディング
-Q
 クエリの文字エンコーディング

などなど
後は

でご確認を

的なファイルがあったとして、
iPhone、Android、その他でデバイス別に各ファイルのアクセス数をソートして見てみたい
といった時

とかとかやれば

的な結果が帰ってくる

JOINもできるみたいなので、色々やれそうで面白いですね。

で、中でどうやってるのかなーとソースを見てみる。

https://github.com/harelba/q/blob/master/bin/q
githubで公開されているのでかる~く流し読み。

ほほぅ なるほど
sqlite使ってるのね
メモリ型でやってるから高速に処理できると。

と、いうことは、sqliteの構文ならそれなりに使えそう。

機会があれば色々使ってみようかな。

この記事を書いた人

のびー
のびー
株式会社ホットポット(現 イー・ガーディアン株式会社)(アルバイト)2005年1月~2006年4月
 ↓
株式会社エディア 2006年4月〜2007年7月
 ↓
株式会社パクレゼルヴ 2007年8月〜2010年7月
 ↓
グルーポン・ジャパン株式会社 2010年8月〜2011年12月
 ↓
ミューズコー株式会社 2012年2月3日〜2013年12月31日
 株式会社パクレゼルヴ からの出向扱いにて所属。
 ↓
株式会社PRECS 2014年1月

いっぱい会社渡り歩いてるように見えるけど、転職は1回しかしてません!