プログラミングと開発環境 – 仙石浩明の日記

Wio Node (ESP8266) に MicroPython をインストールして、Wi-Fi 照度＆人感センサを作ってみた

hiroaki_sengoku — Sun, 11 Jun 2023 23:17:56 +0000

市販されている IoT 機器は、いつサービス終了してしまう (クラウドサーバ停止で使えなくなる) かも知れず、そのたびに API を解析するのは現実的ではないなぁと思っていたところ、 MicroPython (日本語) を使えば手軽に IoT 機器を自作できることに気付いた。

例えば部屋の明るさを Wi-Fi 経由でサーバへ通知する照度センサは、こんな感じで書ける:

import machine
import socket
import network_cfg

pwr = machine.Pin(15, machine.Pin.OUT)
pwr.value(1)

def webhook(v):
    addr = socket.getaddrinfo('gt.gcd.org', 12345)[0][-1]
    s = socket.socket()
    s.connect(addr)
    s.send('{"magic":"'+network_cfg.MAGIC+'","type":"Illuminance", "Darkness":"'+str(v)+'", "DeviceName":"wionode"}\n')
    s.close()

adc = machine.ADC(0)

def illumi(p):
    darkness = adc.read()
    try:
        webhook(darkness)
    except OSError as exc:
        print("exception\n")

tim = machine.Timer(-1)
tim.init(period=60000, callback=illumi)

webhook(v) はサーバ (この例では gt.gcd.org のポート 12345番。 LAN 内のサーバなので外部からはアクセスできない) へ通知する関数。「adc.read()」で照度センサの値 (0 〜 1024) を読み取って、 webhook(v) でサーバへ通知するだけ。タイマを使って 60秒ごとに illumi 関数を実行して、その時点の照度をサーバへ通知するようにしてみた。

C などのコンパイル型言語と違って、 Python だから対話的にコード片を実行してみることができて (REPL)、とりあえず動くプログラムを書くだけなら、あっと言う間に書ける。 Arduino のスケッチみたいに、いちいち「コンパイルしてボードへ書込んで実行」を何度も何度も繰り返すのと比べると、 REPL は圧倒的に楽。 IoT 機器だと実行速度はさほど要求されない (ことが多い) わけで、 REPL 一択だと思う。

いわゆる「ラズパイ電子工作」だとブレッドボードで配線するのが定番で、ブレッドボードだから配線を手軽にできるのはいいのだけど、 IoT 機器として実地に使おうとすると電子部品が剥き出しのままでは困るし、ケースにいれると大きすぎて設置方法に困る。

その点、 Wio Node (Seeed Studio 102110057) は、極めてコンパクトなのに Grove コネクタが 2個ついているので、 Grove シリーズと互換なセンサ類をつなぐだけ。電子部品の出っ張りとかが無いので、ケースにいれなくてもそのまま使えそう (というか実際、このままで実地に使っている)。

Wio Node の 2個の Grove コネクタに、照度センサと人感センサをつないでみた。写真中央左寄りが M5Stack用光センサユニット (517円) で、写真右上が HC-SR312 (AM312) 人体検知センサ (1個 166円)。 Wio Node (写真下) は私が買ったとき (2021年11月) は 1250円だったのに、急に値上がりして今は 1700円くらい。

値上がりしてしまったとはいえ、合計 2400円くらいで Wi-Fi 通信する照度＆人感センサが作れてしまう。いつサービス終了してしまうか恐れながら市販の IoT 機器を使うよりずっといい。

Grove コネクタは黄白赤黒の 4ピン。黄と白は信号線で、赤は電源 (5V or 3.3V)、黒は GND。 Seeed studio オリジナルの Grove ケーブルは 1番ピンが黄色 (写真左側) だけど、 M5Stack などの互換ケーブルだと 1番ピンが白色で白黄赤黒の順番 (写真右側)。

オリジナルと互換ケーブルとでは黄と白が入れ替わっているが、違うのは色だけで互換性は配慮されている (と思う)。例えば、アナログ出力の Grove センサのほとんど (全て?) は、 1番ピンがアナログ信号線となっている。

3番ピン(赤) は、 Wio Node の場合 3.3V が供給されるが、 M5Stack や Arduino だと 5V のものが多いので注意を要する。例えば人感センサの定番 HC-SR501 (1個 136円) の電源電圧は 5V 〜 20V なので Wio Node の Grove コネクタから電源を供給することはできない。

Wio Node は PORT 1 (写真右側の Grove コネクタ) がアナログ信号を入力することができて、前掲のプログラムのように

import machine

adc = machine.ADC(0)
darkness = adc.read()

などとすることで PORT 1 の 1番ピンに印加された電圧を読み取ることができる。このプログラムの場合、入力電圧 0V 〜 3V に対して変数 darkness は 0 〜 1024 となる。 3V 以上では常に 1024 となった。

M5Stack用光センサユニットは照度に応じた電圧を 1番ピンに出力する。 Wio Node PORT 1 に接続した場合、その電圧を受けて変数 darkness が 0 (照度最大) 〜 1024 (真っ暗) になる。また、2番ピンには 0 (明) または 1 (暗) のデジタル値を出力する。 0/1 の閾値 (つまり 0 が出力される照度の最小値) は、ユニット表面にある可変抵抗で設定できる。

Wio Node PORT 1 の 2番ピンは ESP8266 (Wio Node のマイクロコントローラ) の GPIO 4 につながっているので、

drk = machine.Pin(4, machine.Pin.IN)

drk.irq(trigger=machine.Pin.IRQ_RISING | machine.Pin.IRQ_FALLING,
        handler=illumi)

などと GPIO 4 の 0/1 が変化したときに割り込みが起きるようにしておけば、タイマによる一定間隔の割り込みに加えて、照度が閾値を超えた瞬間に照度をサーバへ通知することができる。例えば部屋の照明を (手動で) オン/オフした瞬間をサーバが検知できる。

Wio Node の PORT 0 には前掲の写真のように人感センサ HC-SR312 をつないだ。 1番ピン(黄) を HC-SR312 のセンサピン (写真左中央) につなぎ、 3番ピン(赤) を電源ピン (写真左上)、 4番ピン(黒) を GND ピン (写真左下) につなぐ。

HC-SR312 には説明書がついていない (日本の Amazon で注文したのにキルギスから届いた) し、基板のシルク印刷にもピンの役割は書かれていなかったので、接続方法は基板の配線パターンから推測した。人の動きを検出すると、センサピンから 1 のデジタル値を出力する。

人感センサ HC-SR312 は接続がピンヘッダなので、そのまま実地に使うにはやや難があるが、 M5Stack用PIRセンサユニット UNIT-PIR なら Grove コネクタで接続できる。

でもケースに入ってる分、UNIT-PIR は割高 (←写真では 825円もする)。他製品と比べるとフレネルレンズの口径が小さいので、広範囲の人の動きを検知したい場合は不向きかもしれない。

HC-SR312 と UNIT-PIR、どちらの人感センサも AS312 PIR センサを使っていて 3.3V 電源で使うことができる。ちなみに PIR は「Pyroelectric Infrared Radial」つまり「焦電赤外線放射」の略。 PIR センサには、赤外線放射を集めるための半球状の白いフレネルレンズがついている。

人感センサ (HC-SR312 または UNIT-PIR) のセンサピンをつないだ Wio Node PORT 0 の 1番ピン(黄) は ESP8266 の GPIO 3 につながっているので、 GPIO 3 の 0/1 が変化したときに割り込みが起きるようにして、その時の GPIO 3 の値を webhook(v) でサーバへ通知すればよい。

led = machine.Pin(2, machine.Pin.OUT)
rx  = machine.Pin(3, machine.Pin.IN)

def pir(p):
    v = p.value()
    try:
        webhook(v)
    except OSError as exc:
        print("exception\n")
    if v > 0:
        led.value(0)
    else:
        led.value(1)

rx.irq(trigger=machine.Pin.IRQ_RISING | machine.Pin.IRQ_FALLING,
       handler=pir)

Wio Node では GPIO 2 に 0 を出力すると青LED が点灯し、 1 を出力すると消灯する。人感センサが人の動きを検知したときに青LED が点灯するようにしてみた。

Wio Node における GPIO のまとめ:

GPIO	役割
0	FUNC ボタンの状態 (0:押下, 1:離上)
1	PORT 0 の 2番ピン(白)
2	青 LED (1:消灯, 0:点灯)
3	PORT 0 の 1番ピン(黄)
4	PORT 1 の 2番ピン(白)
5	PORT 1 の 1番ピン(黄)
15	PORT 0 および 1 への電源供給 (1:ON, 0:OFF)

Wio Node には、 Wio Link のコントローラとして動作させるためのファームウェアがあらかじめ書き込まれている。 Wio Link はプログラミング不要で IoT アプリケーションを構築できるのが「売り」らしいが、むしろプログラミングしたい私は、速攻でファームウェアを MicroPython に書き換えた。

見れば明らかだが Wio Node には ESP-WROOM-02 (ESP8266EX を搭載した Wi-Fi モジュール) がそのまま載っている (写真左下)。したがって ESP8266 用の MicroPython ファームウェアを書込んで使うことができる。

まず Wio Node の PORT 0 に TTL シリアル通信ケーブルをつなぐ。 TTL レベル (3.3V) でシリアル通信ができるものであれば何でも使える (はず)。私は M5Stack用 ESP32ダウンローダキット (写真上) を使った。 Wio Node は M5Stack ではないし ESP32 でもないが、問題なく使える。 PORT 0 の 1番ピン(黄) が RX で、2番ピン(白) が TX (シルク印刷の矢印の向きが直感的でないので注意)。

Wio Node の Func ボタンを押しながら RST ボタンを押して離し (RST を離してから Func を離す)、 esptool.py コマンドでファームウェアを書込む:

senri:/ftp/pub/ESP8266 $ wget https://micropython.org/resources/firmware/esp8266-20230426-v1.20.0.bin
Length: 634016 (619K) [application/octet-stream]
Saving to: ‘esp8266-20230426-v1.20.0.bin’

esp8266-20230426-v1 100%[===================>] 619.16K   620KB/s    in 1.0s    

2023-06-10 09:37:47 (620 KB/s) - ‘esp8266-20230426-v1.20.0.bin’ saved [634016/634016]

senri:/ftp/pub/ESP8266 $ esptool.py -p /dev/ttyACM1 -b 115200 write_flash --flash_size=detect 0 esp8266-20230426-v1.20.0.bin
esptool.py v3.1
Serial port /dev/ttyACM1
Connecting....
Detecting chip type... ESP8266
Chip is ESP8266EX
Features: WiFi
Crystal is 26MHz
MAC: 5c:cf:7f:XX:XX:XX
Uploading stub...
Running stub...
Stub running...
Configuring flash size...
Auto-detected Flash size: 4MB
Flash will be erased from 0x00000000 to 0x0009afff...
Flash params set to 0x0040
Compressed 634016 bytes to 420365...
Wrote 634016 bytes (420365 compressed) at 0x00000000 in 37.3 seconds (effective 136.0 kbit/s)...
Hash of data verified.

Leaving...
Hard resetting via RTS pin...

この実行例では「Flash size: 4MB」と表示されているが、 ESP-WROOM-02 のフラッシュメモリは 2016年12月頃から 2MB になったらしい。この Wio Node は 2021年11月に千石電商で買った (1250円)。パッケージの日付は 2021年4月 (04/16/21)。

MicroPython は普通の Python と同様 REPL (Read-Eval-Print Loop) をサポートしている。「import webrepl_setup」を実行してパスワードを設定すると Web ブラウザで Wi-Fi 経由で REPL が使える。 Grove コネクタの両方にセンサ等をつなぐと、シリアル通信ができなくなるので、 Web ブラウザで REPL を使えるようにしておくべき。

senri:~ $ cu -s 115200 -l /dev/ttyACM1
Connected.

>>> help()
Welcome to MicroPython!

For online docs please visit http://docs.micropython.org/en/latest/esp8266/ .
For diagnostic information to include in bug reports execute 'import port_diag'.

Basic WiFi configuration:

import network
sta_if = network.WLAN(network.STA_IF); sta_if.active(True)
sta_if.scan()                             # Scan for available access points
sta_if.connect("", "") # Connect to an AP
sta_if.isconnected()                      # Check for successful connection
# Change name/password of ESP8266's AP:
ap_if = network.WLAN(network.AP_IF)
ap_if.config(ssid="", security=network.AUTH_WPA_WPA2_PSK, key="")

Control commands:
  CTRL-A        -- on a blank line, enter raw REPL mode
  CTRL-B        -- on a blank line, enter normal REPL mode
  CTRL-C        -- interrupt a running program
  CTRL-D        -- on a blank line, do a soft reset of the board
  CTRL-E        -- on a blank line, enter paste mode

For further help on a specific object, type help(obj)
>>> import webrepl_setup
WebREPL daemon auto-start status: disabled

Would you like to (E)nable or (D)isable it running on boot?
(Empty line to quit)
> e
To enable WebREPL, you must set password for it
New password (4-9 chars): XXXXXXXX
Confirm password: XXXXXXXX
Changes will be activated after reboot
Would you like to reboot now? (y/n) y

Web クライアントをダウンロードして Web ブラウザで webrepl.html をアクセスすることで、ブラウザ上で MicroPython の REPL が使える。ファイル転送機能もある。

M5Stack ATOM Lite を USBシリアル変換アダプタにしてみた〜 Raspberry Pi Pico の UART コンソールを使う〜

hiroaki_sengoku — Tue, 24 Aug 2021 08:19:36 +0000

はじめてラズパイを買ったら意外に面白くてハマってしまった。電子工作なんて 30年ぶりで、半田ごてを握るには年を食いすぎている (手元がふるえる) のだけど、ブレッドボードやら電子パーツやらをいろいろ買い揃えて、オリンピックが終わってからの 2週間、寝る間も惜しんで楽しんでいる。

Raspberry Pi Zero WH が 1848円、 Raspberry Pi Pico が 550円、 M5Stack ATOM Lite が 1287円。安いので次々と買ってしまった。ラズベリーパイ (Raspberry Pi)、略してラズパイと呼ばれるようになって久しいが、 M5Stack をはじめとする ESP32 (や ESP8266) を使ったコントローラは、何と呼ばれているのだろう？

Raspberry Pi Zero WH は普通の Linux マシンなので何でもありだが、他はマイコン (マイクロコンピュータ) ならぬマイクロコントローラなので、普通の OS を動かすことは難しく制約が多くて一筋縄にはいかない。

ググってみると、開発環境として Arduino IDE を使い C (C++ ?) や Java などで開発している人が多いようだ。 30年前ならいざ知らず、マイクロコントローラと言えども計算リソースが潤沢にある (30年前の汎用機並?) 昨今、なぜコンパイラ言語 (しかも C や Java みたいなアセンブラと大差ない低級言語) を使うのか？インタプリタ言語なら対話的にコード片を実行して、動作を確認しながらプログラミングできる (REPL, Read-Eval-Print Loop) ので、開発効率が圧倒的に高い。

というわけで、わたし的には MicroPython 一択 (ちなみに Python を使うのは今回がはじめて) なのであるが、困ったことに Raspberry Pi Pico (以下 Pi Pico と略記) は、開発環境である PC との通信手段が限られる。 USB コネクタが一つしかなく、 M5Stack ATOM Lite 等と違って Wi-Fi 機能もない。つまり、 Pi Pico に USB 機器をつなぐ (Pi Pico が USB ホスト) 場合は、 USB で PC へつなぐ (PC が USB ホスト) ことができなくなるので、 PC と通信する手段が無くなってしまう。プログラム実行中に PC と通信できなくては REPL にならない。

USB (Universal Serial Bus) がダメなら Universal じゃないシリアル通信を使えばいい、ということで Pi Pico にもシリアル通信のための UART (Universal Asynchronous Receiver/Transmitter, 調歩同期式汎用送受信機) が装備されている (ただし Pi Pico 用の MicroPython は UART では REPL できないので再ビルドの必要がある。後述)。 PC 側でも UART 機能があれば通信できる。というか USB や Wi-Fi が無かった時代は UART 通信 (RS-232C など) の方が一般的だった。

ところが、いまどきの UART は 3.3V だという。 ±3～25V の信号線を使っていた RS-232 規格とは隔世の感がある。 ±25V な機器はさすがに捨ててしまったが、いまでも手元にある USBシリアル変換アダプタは 0〜5V (TTL レベル) のものばかり。

5V を Pi Pico が扱える 3.3V まで下げるのは抵抗を使って分圧すればいいが、その逆、つまり Pi Pico から PC へ 5V の信号を伝えるのは少々やっかいである。 3.3V のままでも PC に H レベルと認識してもらえなくもないが、マージンが狭くなるのは否めない。もちろん 115200bps とかなら問題も起きないだろうが、現代なら 1.5Mbps くらいは出したいところ。

もちろん素直に 3.3V 対応の USB to TTLシリアルアダプタを買えばいいのだが、 USBシリアル変換アダプタを既に (何個も) 持っているのに新たに買うのはモッタイナイ気がするし、元々 200〜300円くらいしかしないパーツを、本体と同じくらいの送料を払って買うのも業腹である (こんど秋葉原へ行ったときにでも買おうっと)。

要は 3.3V な UART があればいいわけで、 M5Stack ATOM Lite (以下 ATOM Lite と略記) を USB シリアルアダプタにしてしまえばいい！と思いついた。つまり ATOM Lite も Pi Pico と同様 USB で REPL が使えるが、 ATOM Lite の REPL ではなく、 ATOM Lite (写真上) と UART シリアル (写真上の 3本のジャンパー線, うち黒は GND) でつないだ先の Pi Pico (写真下) の REPL を使おうという目論見。 ATOM Lite は PC と Pi Pico との通信を中継するだけ。 ATOM Lite もチップの名前は ESP32-PICO-D4 なのでダブルピコ！

PC (開発環境) ←──USB──→ ATOM Lite ←──UART──→ Pi Pico

MicroPython では flash メモリに boot.py を置いておくと起動時に実行してくれる。 ATOM Lite を常にシリアルアダプタとして使いたいわけではないので、 ATOM Lite のボタンを押しながら起動したときだけシリアルアダプタとして機能するようにしてみた。シリアルアダプタとして動作中はボタン中央の LED が緑色に点灯する。もう一度ボタンを押すと LED が消灯し、通常の REPL モードになる。 boot.py に以下のプログラムを追記した:

import machine
import sys
import neopixel
import utime
import _thread

btn = machine.Pin(39, machine.Pin.IN)
if btn.value():
    sys.exit()

pxls = neopixel.NeoPixel(machine.Pin(27), 1)
pxls[0] = (0, 25, 0)
pxls.write()
start_time = utime.time()

uart = machine.UART(1, 115200, tx=21, rx=25)
done = False

def thread():
    global done
    while not done:
        c = sys.stdin.read(1)
        if c == "\n":
            uart.write("\r\n")
        else:
            uart.write(c)
    _thread.exit()

_thread.start_new_thread(thread,())

while not done:
    if btn.value() == 0:
        if utime.time() - start_time > 10:
            done = True
    if uart.any() > 0:
        sys.stdout.write(uart.read(1))
    else:
        utime.sleep_ms(1)

pxls[0] = (0, 0, 0)
pxls.write()

ATOM Lite の GPIO 21番ピンを UART TX として、 GPIO 25番ピンを UART RX として使い、それぞれ Pi Pico の UART0 RX および UART0 TX につなぐ。 Pi Pico の VBUS と GND に 5V 電源を供給する (写真右下の赤と黒のジャンパー線) ことで USB コネクタを使わずに空けておける。

はじめての Python (文法すらろくに知らなかった) だけど、 ATOM Lite をシリアルアダプタとして使うことを思いついてから、実際に使えるようになるまで半日もかかっていない。まさに REPL さまさま。

MicroPython ESP32 版は poll クラスがサポートされていないようなので、スレッドを用いた。また stdin (標準入力) を生のまま (バイナリとして) 入力することができず、 0x00〜0x1F のコントロール文字を中継することができない。例えば REPL ではプログラムの実行を止めたいときは Control-C を押すが、 Pi Pico で実行中のプログラムではなく、 ATOM Lite で実行中の boot.py が止まってしまう。実用を考えるなら C で書き直すべきだが、プロトタイプとしてならこれで充分。 (8月26日追記: C で書き直してみた)

ATOM Lite のボタン中央の LED には Neo Pixel LED が使われている。単なる RGB LED (赤, 緑, 青の 3つの発光ダイオードが一つの LED パッケージに封入されている) とは異なり、一つ一つの LED にコントロール用の IC が内蔵されていて、 1本の信号線で多数の LED (例えば長尺のテープに実装したり、マトリックス状に配置してサイネージのピクセルとして使う) を自在にコントロールできる。

MicroPython では前掲したプログラムのように配列 (pxls[]) の各要素が一つの LED に対応していて、 RGB の値をそれぞれ書込むことで多数の LED の色・明るさを自由に設定できる。 ATOM Lite のように LED 一つだけだとあまり意味がない (pxls[0] の値を変えるだけ) が、それでも Neo Pixel に触れてみるという目的には有用と思う。実際、私も初めて使った。 ATOM Lite に 6軸 IMU (慣性計測装置) MPU6886 を追加した上位機種 ATOM Matrix には 25個の Neo Pixel が実装されているが、 Neo Pixel の本領を発揮するには数千〜数万個 (数百万個?) の LED が欲しいところ。

なお、ここまで書いておいてアレだが、 Pi Pico 用に提供される MicroPython のファームウェアは UART シリアルで REPL できない。 ports/rp2/mpconfigport.h の設定を一箇所書き換え (MICROPY_HW_ENABLE_UART_REPL を 1 に変更) て、ファームウェアをビルドし直す必要がある。

diff --git a/ports/rp2/mpconfigport.h b/ports/rp2/mpconfigport.h
index ccf11d4..2c59047 100644
--- a/ports/rp2/mpconfigport.h
+++ b/ports/rp2/mpconfigport.h
@@ -35,7 +35,7 @@
 
 // Board and hardware specific configuration
 #define MICROPY_HW_MCU_NAME                     "RP2040"
-#define MICROPY_HW_ENABLE_UART_REPL             (0) // useful if there is no USB
+#define MICROPY_HW_ENABLE_UART_REPL             (1) // useful if there is no USB
 #define MICROPY_HW_ENABLE_USBDEV                (1)
 
 // Memory allocation policies

この手の設定変更はソースを書き換えるのではなく、環境設定ファイルの変更だけで済むようにしたほうがいいと思うのだけど...

ビルドには (当然ながら) クロスコンパイル環境が必要。といっても既に Arduino IDE を利用して Pi Pico 用のプログラムを開発している PC なら Pi Pico のバイナリを生成できるクロスコンパイル環境がインストールされているハズで、 ~/.arduino15/packages/rp2040/tools/pqt-gcc 以下の gcc を PATH に含めるだけでよい。ファームウェアの再ビルドというと紆余曲折がつきものだが、あっさりビルドできてしまって拍子抜け。 ports/rp2/build-PICO/firmware.uf2 が得られるので、 Pi Pico の BOOTSELボタンを押しながら PC に接続したときに現れるストレージへ、この firmware.uf2 ファイルをコピーするだけでファームウェアの書き換えが完了。

以下、Linux サーバ上でのビルド作業の記録 (一部省略):

senri:/usr/local/src $ git clone https://github.com/micropython/micropython.git
Cloning into 'micropython'...
　　　・・・
senri:/usr/local/src $ cd micropython
senri:/usr/local/src/micropython $ git submodule update --init -- lib/pico-sdk
Submodule 'lib/pico-sdk' (https://github.com/raspberrypi/pico-sdk.git) registered for path 'lib/pico-sdk'
Cloning into '/usr/local/src/micropython/lib/pico-sdk'...
Submodule path 'lib/pico-sdk': checked out 'bfcbefafc5d2a210551a4d9d80b4303d4ae0adf7'
senri:/usr/local/src/micropython $ git submodule update --init -- lib/tinyusb
Submodule 'lib/tinyusb' (https://github.com/hathach/tinyusb) registered for path 'lib/tinyusb'
Cloning into '/usr/local/src/micropython/lib/tinyusb'...
Submodule path 'lib/tinyusb': checked out 'd49938d0f5052bce70e55c652b657c0a6a7e84fe'

senri:/usr/local/src/micropython $ export PATH=/home/sengoku/.arduino15/packages/rp2040/tools/pqt-gcc/1.3.1-a-7855b0c/bin:$PATH
senri:/usr/local/src/micropython $ make -C mpy-cross
　　　・・・
LINK mpy-cross
   text	   data	    bss	    dec	    hex	filename
 269329	    776	    896	 271001	  42299	mpy-cross
make: Leaving directory '/usr/local/src/micropython/mpy-cross'
senri:/usr/local/src/micropython $ cd ports/rp2
senri:/usr/local/src/micropython/ports/rp2 $ make
[ -d build-PICO ] || cmake -S . -B build-PICO -DPICO_BUILD_DOCS=0 -DMICROPY_BOARD=PICO
PICO_SDK_PATH is /usr/local/src/micropython/lib/pico-sdk
Defaulting PICO_PLATFORM to rp2040 since not specified.
Defaulting PICO platform compiler to pico_arm_gcc since not specified.
PICO compiler is pico_arm_gcc
-- The C compiler identification is GNU 10.3.0
-- The CXX compiler identification is GNU 10.3.0
-- The ASM compiler identification is GNU
-- Found assembler: /home/sengoku/.arduino15/packages/rp2040/tools/pqt-gcc/1.3.1-a-7855b0c/bin/arm-none-eabi-gcc
PICO target board is pico.
Using board configuration from /usr/local/src/micropython/lib/pico-sdk/src/boards/include/boards/pico.h
-- Found Python3: /usr/bin/python3 (found version "3.9.6") found components: Interpreter 
TinyUSB available at /usr/local/src/micropython/lib/tinyusb/src/portable/raspberrypi/rp2040; adding USB support.
Found User C Module(s): 
-- Configuring done
-- Generating done
-- Build files have been written to: /usr/local/src/micropython/ports/rp2/build-PICO
make -s -C build-PICO
　　　・・・
[ 99%] Linking CXX executable firmware.elf
   text	   data	    bss	    dec	    hex	filename
 280172	     88	 201652	 481912	  75a78	/usr/local/src/micropython/ports/rp2/build-PICO/firmware.elf
[100%] Built target firmware

git clone でソースプログラム一式をダウンロードして、 make -C mpy-cross で MicroPython のクロスコンパイラをビルドして、 make で ARM EABI (Embedded Application Binary Interface) 版 MicroPython をビルド。

8/26 追記:

前掲の Python プログラムを C で書き直してみた。 ESP-IDF は有難いことに UART select() をサポートしているのでスレッドを使わずに USB ⇔ UART 中継プログラムが書けるが、 UART がハードウェアフロー制御 (RTS CTS) を使えないと嬉しさ半減といったところ。

#include 
#include 
#include 
#include 
#include 
#include 
#include "sdkconfig.h"
#include "esp_log.h"
#include "esp_vfs_dev.h"
#include "driver/uart.h"

static const char* TAG = "usb_uart";

const int buf_max = 256;

void app_main(void)
{
    uart_config_t uart_config = {
        .baud_rate = 115200,
        .data_bits = UART_DATA_8_BITS,
        .parity    = UART_PARITY_DISABLE,
        .stop_bits = UART_STOP_BITS_1,
        .flow_ctrl = UART_HW_FLOWCTRL_DISABLE,
        .source_clk = UART_SCLK_APB,
    };

    ESP_ERROR_CHECK(uart_param_config(UART_NUM_0, &uart_config));
    ESP_ERROR_CHECK(uart_driver_install(UART_NUM_0, 2*1024, 0, 0, NULL, 0));

    ESP_ERROR_CHECK(uart_param_config(UART_NUM_1, &uart_config));
    ESP_ERROR_CHECK(uart_set_pin(UART_NUM_1, 21, 25, -1, -1));
    ESP_ERROR_CHECK(uart_driver_install(UART_NUM_1, 2*1024, 0, 0, NULL, 0));

    while (1) {
        int fd[2];
	int len[2];
	char buf[2][buf_max];
	fd_set rin, win, ein;
	fd_set rout, wout, eout;
	int i;

        if ((fd[0] = open("/dev/uart/0", O_RDWR)) == -1) {
            ESP_LOGE(TAG, "Cannot open UART 0");
            usleep(5000000);
            continue;
        }
        if ((fd[1] = open("/dev/uart/1", O_RDWR)) == -1) {
            ESP_LOGE(TAG, "Cannot open UART 1");
	    close(fd[0]);
            usleep(5000000);
            continue;
        }
	FD_ZERO(&rin);
	FD_ZERO(&win);
	FD_ZERO(&ein);
	for (i=0; i < 2; i++) {
	    struct termios termios;
	    esp_vfs_dev_uart_use_driver(i);
	    fcntl(fd[i], F_SETFL, O_NONBLOCK);
	    FD_SET(fd[i], &rin);
	    tcgetattr(fd[i], &termios);
	    termios.c_iflag &= ~(IGNBRK | BRKINT | PARMRK | ISTRIP
				 | INLCR | IGNCR | ICRNL | IXON);
	    tcsetattr(fd[i], TCSANOW, &termios);
	}

        while (1) {
            int ret;
	    int i;
	    struct timeval tv = {
		.tv_sec = 1,
		.tv_usec = 0,
	    };
	    rout = rin;
	    wout = win;
	    eout = ein;
            ret = select(FD_SETSIZE, &rout, &wout, &eout, &tv);
	    if (ret < 0) break;
	    for (i=0; i < 2; i++) {
		if (FD_ISSET(fd[i], &rout)) {
		    len[i] = read(fd[i], buf[i], buf_max);
		    if (len[i] > 0) {
#ifdef USE_HW_FLOWCTRL
			FD_CLR(fd[i], &rin);
			FD_SET(fd[i], &win);
#else
			write(fd[1-i], buf[i], len[i]);
#endif
		    } else if (len[i] < 0) {
			ESP_LOGE(TAG, "UART %d read error", i);
		    }
		}
#ifdef USE_HW_FLOWCTRL
		if (FD_ISSET(fd[i], &wout)) {
		    int l = write(fd[i], buf[1-i], len[1-i]);
		    if (l == len[1-i]) {
			FD_CLR(fd[i], &win);
			FD_SET(fd[1-i], &rin);
			len[1-i] = 0;
		    } else if (l > 0) {
			memcpy(buf[1-i], buf[1-i]+l, l);
			len[1-i] -= l;
		    } else if (l < 0) {
			ESP_LOGE(TAG, "UART %d write error", i);
		    }
		}
#endif
	    }
	}
	ESP_LOGE(TAG, "Select failed: errno %d", errno);
	close(fd[0]);
	close(fd[1]);
	usleep(5000000);
    }
}

前掲の Python プログラムと同様、 GPIO 21番ピンを UART1 TX に、 GPIO 25番ピンを UART1 RX として使用する。 RTS CTS は使用しないが、 115200bps くらいなら取りこぼしも起きないようなので実用上の問題は無い？

ATOM Lite を USB シリアル変換アダプタ (もちろん C 版) として使って、 Thonny で Pi Pico にアクセスしてみた。ふつうに開発できる。 PC で作成した Python プログラムをアップロードできるし、プログラムの実行を contorl-C で止めることもできる。 ATOM Lite 経由で Pi Pico へアクセスしていることを忘れそう...

MICROPY_HW_ENABLE_UART_REPL の値を 1 にしてビルドした MicroPython なので、バージョンが v1.16-236-gb51e7e9-dirty などと末尾に「-dirty」が付いている。

IFTTT のアプレットが 3個に制限されてしまったので、IFTTT を使わずにスマート家電リモコン RS-WFIREX4 をコントロールしてみた〜 RS-WFIREX4 の通信プロトコルの解析

hiroaki_sengoku — Wed, 16 Sep 2020 04:44:06 +0000

IoT機器を IFTTT (IF This Then That) に登録すると、自前のプログラムからコントロールできるようになる。つまり IFTTT の webhooks を使うことで、 IFTTT の特定の URL を自前のプログラムからアクセスするだけで IoT機器がコントロールできる。例えばこんな感じ:

senri:~ $ curl https://maker.ifttt.com/trigger/light_on/with/key/dD-v7GCx46LnWaF1AD9nwSUeA_N1ALvDHKS57cP1_Md
Congratulations! You've fired the light_on event

「light_on」の部分は任意に定めることができる。この例では照明を点灯させている。

Nature Remo のように API を公開している IoT機器なら、自前のプログラムから API を直接たたけばよいが、残念ながら IoT機器の多くが API 非公開なので、 IFTTT が唯一のコントロール手段となっていた。 IoT機器の操作一つ一つ (例えば light_on) に、 IFTTT アプレットを作ることになるので、私の場合は 50個以上のアプレットを作っていた。

ところが！

有料版の IFTTT Pro が新たに発表され、従来の無料版は登録できるアプレットが 3個に制限されてしまった。有料版なら無制限にアプレットを作ることができるが、無料版だと最大 3個しかアプレットを作ることができない。

かくなる上は、 IoT機器の API (通信プロトコル) を解析して IFTTT 抜きで IoT機器をコントロールするしかない。いままでも IFTTT に登録できない IoT機器については API を解析していたので、なんとかなるだろう。

IoT機器のほとんど (全て?) がスマホからコントロールできるので、 root 権限を取得できる Android 端末があれば、スマホのアプリと IoT機器との間の通信を tcpdump 等で観察することができる。通信が暗号化されていなければ API を解析するのは (比較的) 容易。

というわけで、ラトックシステム社スマート家電リモコン RS-WFIREX4 の API を解析してみた。幸い、 RS-WFIREX4 の Android 用アプリスマート家電コントローラは、家中モード (スマホと RS-WFIREX4 が同一セグメントにある場合) では通信が暗号化されていない。スマホ上で tcpdump を実行することで通信 (TCP/IP) 内容を見ることができた。

RS-WFIREX4 は温度、湿度、明るさを計測することができる。アプリが RS-WFIREX4 の TCP ポート 60001番に対して 5バイトのデータ「AA 00 01 18 50」を送信すると、 RS-WFIREX4 から 13バイトのデータ「AA 00 09 18 00 01 5E 00 E5 00 0A B2 08」が返ってきた。最初の 5バイト「AA 00 09 18 00」は部屋の温度等に関係なく常に同一だったので、ヘッダ (つまり計測データは含まれない) と考えられる。

この手の通信プロトコルでは、可変長のデータを扱うためにヘッダにペイロード (ヘッダ以外のデータ本体) の長さが含まれる (ことが多い)。この例ではヘッダ以外のデータの長さは 13 - 5 = 8 バイトなので、おそらく「00 09」が (ビッグエンディアンの) ペイロード長だろうとあたりをつける。つまりヘッダは「AA 00 09 18」の 4バイトで、続く 9バイト「00 01 5E 00 E5 00 0A B2 08」がペイロードということになる。

┌─┬─┬─┬─┬─┐
│頭│ペイ長│測│検│
└─┴─┴─┴─┴─┘
│←─ヘッダ─→│ペ│

アプリが送信したデータ「AA 00 01 18 50」も、先頭が「AA」 (図中では「頭」と略記) であることから同じフォーマットである可能性が高い。つまり「00 01」がペイロード長 (図中では「ペイ長」と略記) で、「50」の 1バイトがペイロードなのだろう。「50」は「計測データを送信せよ」という命令の可能性も無くはないが、おそらく後述するチェックサムだろう (図中では「検」と略記)。

そして、ヘッダ末尾の「18」のほうが、「計測データを送信せよ」という命令である可能性が高い (図中では「測」と略記)。 RS-WFIREX4 の応答のヘッダの末尾も「18」だが、これは命令「18」に対する応答であることを示しているのだろう。

┌─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
│頭│ペイ長│測│０│湿度％│温度℃│明るさ│安│検│
└─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘
│←─ヘッダ─→│←─────ペイロード─────→│

部屋を明るくしたり暗くしたり、温度を上げたり下げたりしたときに、 RS-WFIREX4 からの応答がどのように変化するか調べることで、ペイロードの 2, 3バイト目「01 5E」 (10進数で 350) は、「湿度 35.0 %」を示していると推測できた。以下同様に、 4, 5バイト目「00 E5」 (10進数で 229) は、「温度 22.9 ℃」を、 6, 7バイト目「00 0A」 (10進数で 10) は、「明るさ」を示している。

ペイロードの 8バイト目「B2」は、 RS-WFIREX4 の電源を入れた瞬間は 0 で、時間の経過と共に増大し、充分時間が経つと 255 になる。 RS-WFIREX4 は電源投入後 30分間はセンサーが使えないので、おそらくセンサーの安定度合い (0〜255) を示していて、この数値が一定以上 (255?) でないとセンサーの値が正確でないことを示しているのだろう。

末尾の 1バイトは後述するチェックサムと思われる。なぜなら、末尾の 1バイトを除くペイロードの内容が同じ (つまり湿度・温度・明るさ・安定度の組合わせが同一) 応答データであれば、末尾の 1バイトも (少なくとも私が観察した範囲では) 同じ値になっているから。

AA 00 AE 11
00 00 AA
22 11 04 04 05 04 04 0D 04 0D 04 04 05 0C 05 04
04 04 05 04 04 0D 04 04 05 04 04 0D 04 04 05 0C
05 04 04 0D 04 04 05 04 04 0D 04 04 05 04 04 04
05 04 04 04 05 04 04 0D 04 0D 04 04 05 0C 05 04
04 04 05 0C 05 04 04 0D 04 04 05 04 04 0D 04 04
05 04 04 FF FF FF 07 23 10 05 04 04 04 05 0C 05
0C 05 04 04 0D 04 04 05 04 04 04 05 0C 05 04 04
04 05 0C 05 04 04 0D 04 04 05 0C 05 04 04 04 05
0C 05 04 04 04 05 04 04 04 05 04 04 04 05 0C 05
0C 05 04 04 0D 04 04 05 04 04 0D 04 04 05 0C 05
04 04 04 05 0C 05 04 04 04 05
69

次に赤外線を発射させて家電をコントロールしてみる。

← 左の 178バイトのデータをアプリが送信すると、 RS-WFIREX4 が発射した赤外線を受けて天井照明が点灯し、 RS-WFIREX4 から 6バイトの応答「AA 00 02 11 00 D1」が返ってきた。

送信データの最初の 4バイト「AA 00 AE 11」がヘッダで、ペイロードの長さが 00AE (10進数だと 174) であることが分かる。ヘッダ末尾の「11」が、「赤外線を発射せよ」という命令なのだろう (図中では「射」と略記)。アプリを操作して RS-WFIREX4 にいろいろ (長さが異なる) 赤外線を発射させてみたところ、 3行目「22 11 04 04 ...」から始まる 170バイトが赤外線の波形データ (後述) で、その直前 (2行目) の「00 AA」 (10進数で 170) が赤外線の波形データの長さ (図中では「デー長」と略記) を表わしているようだ。

┌─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
│頭│ペイ長│射│０│デー長│赤外線の波形データ│検│
└─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘
│←─ヘッダ─→│←─────ペイロード─────→│

ペイロード末尾の 1バイト「69」の算出方法は不明だが、赤外線の波形データによって値が変わることと、末尾であることからチェックサムのようなものと思われる。もちろん単純なチェックサムではなく、なんらかのエラー検出符号のようなものなのだろう (図中では「検」と略記)。この 1バイトは、「ペイロード長」には含まれるが、「赤外線の波形データの長さ」には含まれない (12月18日追記: 「射」をヘッダではなくペイロードに含めて、その代わり「検」をペイロードから外すべきだった。後述)。

このペイロード末尾の 1バイトだけ異なるデータを送信すると RS-WFIREX4 はこの 178バイトの送信データ全体を無視する。赤外線も発射しないし、何の応答も返さない。前述したように家中モードでは何のセキュリティもないので、この末尾の 1バイトが (正規の) アプリから送信されたことを保証する唯一の認証手段なのだろう。ここでは、 RS-WFIREX4 に対する送信データ (あるいは RS-WFIREX4 からの応答データ) におけるこの末尾の 1バイトを「チェックサム」と呼ぶことにする。

170バイトの赤外線の波形データは、 1バイト目の「22」(10進数だと 34) が赤外線の ON の区間を表し、 2バイト目の「11」が赤外線の OFF の区間を表し、以下同様に奇数バイト目が赤外線の ON の区間を表し、偶数バイト目が赤外線の OFF の区間を表す。各バイトの数値の 1/10000 が各区間の秒数になる。例えば「04」の場合は 0.4ミリ秒になり、家製協(AEHA)フォーマットの 1T 区間に相当する。 1バイト目の「22」は 8T 区間、 2バイト目の「11」は 4T 区間、 8バイト目の「0D」は 3T 区間に相当する。

つまり赤外線の波形データの最初の行 (3行目) は、赤外線 ON が 8T (3.2ミリ秒) 続き、次に OFF が 4T (1.6ミリ秒) 続き、以下 ON 1T, OFF 1T, ON 1T, OFF 1T, ON 1T, OFF 3T, ON 1T, OFF 1T, ON 1T, OFF 3T, ON 1T, OFF 1T という波形になる (上図 ↑)。ただし ON の区間は赤外線が点きっぱなしになっているのではなく、 38kHz の赤外線パルス (デューティ比 1/3) を送信している。

この赤外線の波形データは、アプリで「リモコンデータ受け渡し⇒エクスポート⇒メールで送信」を行うことで得られる XML データに含まれる (... の部分)。あるいは他の学習リモコンの赤外線波形データを変換しても良い。

実を言うと、ここまでは昨年の段階で解析済だった。ペイロード末尾の 1バイトの算出方法が判明したら公開しようと思っていたのだが、いろいろ他にも忙しくて :-) 放置してしまっていた (12月18日追記: 単なる CRC-8 だと判明。後述)。アプリを逆コンパイルするのは骨が折れるのと、算出しなくても tcpdump で見れば値が得られるので実用上は困らなかったから。で、今回 IFTTT が有料化したので急遽公開することにした次第。

チェックサムの算出方法が分からないといっても高々 1バイトである。 256通りなんてブルートフォース攻撃というほど brute でもない。幸い、 RS-WFIREX4 はチェックサムが違うデータを立て続けに受信しても、異常動作することはないようだ (もちろん常時チェックサム違いのデータを送信することは推奨できない)。

赤外線の波形データごとに 00 〜 FF まで 256通りのチェックサムを試して、 RS-WFIREX4 から応答が返ってきたら、赤外線の波形データにそのチェックサムを付加して記憶しておけばよい。赤外線の波形データの前の 3バイトおよびヘッダは、発射する際に都度算出すれば良い。

チェックサムが正しい場合、 RS-WFIREX4 は赤外線を発射して「AA 00 02 11 00 D1」を返す。ヘッダ末尾の「11」は、命令「11」 (赤外線を発射せよ) の応答であることを示す。

┌─┬─┬─┬─┬─┬─┐
│頭│ペイ長│射│０│検│
└─┴─┴─┴─┴─┴─┘
│←─ヘッダ─→│←ペ→│

ペイロードは「00 D1」の 2バイトだが、ペイロードが 2バイト以上の場合、ペイロードの先頭は常に「00」であるようだ (図中では「０」と表記)。末尾の「D1」はチェックサムだろう。実質的にチェックサムだけのペイロードならば、 1バイトのペイロードで充分だと思うが、アプリが送信するデータの場合は 1バイトのペイロードが有り得ても、 RS-WFIREX4 が返す応答データの場合は常に 2バイト以上になるのかもしれない。

RS-WFIREX4 をコントロールする perl スクリプト wfirex.pl を以下に示す:

#!/usr/bin/perl
use strict;
use warnings;
use Getopt::Std;
use IO::Socket::INET;

my %Ir;
$Ir{'on'} = pack("H*", "221104040504040D040D0404050C050404040504040D04040504040D0404050C0504040D04040504040D040405040404050404040504040D040D0404050C05040404050C0504040D04040504040D0404050404FFFFFF07231005040404050C050C0504040D040405040404050C05040404050C0504040D0404050C05040404050C050404040504040405040404050C050C0504040D04040504040D0404050C05040404050C050404040569");
$Ir{'off'} = pack("H*", "221005040404050C050C0504040D040405040404050C05040404050C0504040D0404050C05040404050C0504040405040404050C050C050C050C0504040D040405040404050C050C05040404050C0504040405FFFFFF07221104040504040D040D0404050C050404040504040D04040504040D0404050C0504040D04040504040D0404050404040504040D040D040D040D0404050C050404040504040D040D04040504040D040405040437");
$Ir{'small'} = pack("H*", "221104040405040D040D0404040D040504040504040D04040405040D0404050C0504040D04040504040D04040405040404050404050C050C050C0504040D04040405040D040D040D04040504040D0404040504FFFFFF08221104040405040D040D0404050C040504040405040D04040405040D0404050C0405040D04040405040D04040504040404050404040D050C050C0504040D04040504040D040D040D04040405040D0404040504E9");
$Ir{'aoff'} = pack("H*", "211005040404040d0404040d040404040504040c050c040405040404040d040c0405040404040504040405040404040405040404050404040404050c0404050404040405040404040504040c0504040404050404040d040404040504040404050404040c0504040c050c040d040c040d040c04d7");
$Ir{'study_on'} = pack("H*", "2210050C04050404040405040404050404040405040404050404040D0404040504040405040404050404040D040D040404050404040504040405040C0504040D0404040D040D040C050C0405040C0504040D04040405040404050404040405040404050C050C040D040C050C050C040D040D0404050C040405040404050404040504040C0504040D040C050C050C040D040D0404040D0404050404040504040C050C050C0405040C050C040D040D0404040504FF2E2111040C05040405040404050404040404050404040504040405040C0504040404050404040504040405040D040C040504040405040404050404040D0404050C0405040C050C040D040D0404040D0404050C04050404040504040404050404040504040D040C050C040D040D040C050C040D0404050C040504040405040404050404040D0404040D040D040D040C050C050C0405040C0504040404050404040D040D040C0504040D040C050C050C0405040404FF292111040D04040405040404050404040504040405040404050404040D0404040504040405040404050404040D040D040404050404040504040404050C0405040C0504040D040C050C040D0404050C0405040C05040404050404040504040404050404040D040D040C050C050C040D040C050C0504040D040404040504040405040404050C0504040C050C050C040D040D040C0504040D0404040504040404050C040D040D0404050C040D040C050C05040404042F");
$Ir{'study_off'} = pack("H*", "2210040D04050404040504040405040404040504040404050404040D0405040404050404040503050404040D040D040404050404040504040405040C0504040D0404040D040D040C040D0405040C0504040D04040405040404050404040504040405040C050C040D040D040C050C040D040D040C050C04050404040504040405040404050404040D040D040C050C040D040D0404040D0405040404040405040D040D040C0405040C050C040D040D0404040504FF2E2111040D04040405040404050404040504040405040404050404040D0404040504040405040404050404040D040C050404050305040404050404040D0405040C0504040D040C050C040D0404050C0405040C05040404050404040405040404050404040D040D040C050C040D040D040C050C040D040D04040504040405040404050404040504040C050C050C040D040C050C0504040D0404040504040404050C040D040D0404040D040D040C050C0504040404FF292210050C04050404040504040405040404050404040404050404040D0405040404050404040404050404040D040D040404050404040504040405040C0504040D0404040D040D040C050C0405040C0504040D04040405040404050404040405040404050C040D040D040C050C040D040D040D040C050C04050404040405040404050404040504040D040C050C040D040D040D0404040D0404040504040405040D040C040D0405040C040D040D040D040404050408");
$Ir{'study_aoff'} = pack("H*", "2c2b070f0610060f061006050605060f060506050605060406050610060f0605061006050604060506050605060505100610060f06100610060f0610060f060506050605060506040605060506050605060f06100605060f0610060506040605060506050605050506050605061005100610060506040605060506050605050506050610060505100610060505100610060505332d2b0610060f0610061005050605061006050505060506050605060f06100605060f0605060506050605050506050610060f0610061005100610060f06100605060506040605060506050605050506050610060f06050610060f06050605060506050505060506050605060505100610060f06050605060506050505060506050605060f06050610060f06050610060f06050675");

our ($opt_v, $opt_s);
getopts('vs') || help();
my $ip = shift || help();
my $command = shift || help();

if ($command eq "get") {
    my ($il, $te, $hu) = get_wfirex($ip);
    if (defined $il) {
        $te /= 10;
        $hu /= 10;
        print "il=$il te=$te hu=$hu\n";
    } else {
        print "wfirex get TIMEOUT $ip\n";
    }
} elsif (defined $Ir{$command}) {
    my $ret;
    if ($opt_s) {
        my $ir = substr($Ir{$command}, 0, length($Ir{$command})-1);
        for (my $i=0; $i < 256; $i++) {
            my $checksum = pack("C", $i);
            printf("try %02x ...\n", $i);
            $ret = send_wfirex($ip, $ir . $checksum);
            if ($ret) {
                printf("success ! checksum=%02x ret=%02x\n", $i, $ret);
                last;
            }
            sleep 1;
        }
    } else {
        $ret = send_wfirex($ip, $Ir{$command});
    }
}
exit 0;

sub get_wfirex {
    my ($ip) = @_;
    my $sock = IO::Socket::INET->new(
        PeerAddr  => $ip,
        PeerPort  => 60001,
        Proto     => "tcp",
        Timeout   => 5,
        );
    if ($sock) {
        print $sock "\xaa\x00\x01\x18\x50";
        my $buf;
        my $flags;
        $sock->recv($buf, 256, $flags);
        my @data = unpack("CCCCCnnnCC", $buf);
        close($sock);
        print join(" ", @data) . "\n" if $opt_v;
        return ($data[7], $data[6], $data[5]);
    }
    return undef;
}

sub send_wfirex {
    my ($ip, $ir) = @_;
    my $len = length($ir) - 1;
    $ir = "\xaa" . pack("n", $len+4) . "\x11\x00" . pack("n", $len) . $ir;
    my $sock = IO::Socket::INET->new(
        PeerAddr  => $ip,
        PeerPort  => 60001,
        Proto     => "tcp",
        Timeout   => 5,
        );
    if ($sock) {        
        print $sock $ir;
        my $buf;
        my $flags;
        $sock->recv($buf, 256, $flags);
        my @data = unpack("CCCCCC", $buf);
        close($sock);
        if (@data) {
            print join(" ", @data) . "\n" if $opt_v;
        }
        return $data[5];
    }
    return undef;
}

sub help {
    print <  
opt:   -v   ; verbose
       -s   ; scan checksum
com: get    ; get sensor value
EOF
    print "     " . join(" ", sort keys %Ir) . "\n";
    exit 1;
}

連想配列 %Ir に赤外線の波形データを 16進数の文字列で格納しておく。末尾の 2文字 (つまり 16進数 1バイト) がチェックサム。チェックサムが不明のときは、とりあえず「00」をつけておいて「-s」オプションでチェックサムを探索する。

senri:~ $ ./wfirex -vs wfirex4l on
try 00 ...
try 01 ...
try 02 ...
try 03 ...

  … 中略 …

try 67 ...
try 68 ...
try 69 ...
170 0 2 17 0 209
success ! checksum=69 ret=d1

赤外線の波形データ $Ir{'on'} のチェックサムが「69」 (16進数) であることが判明したので、とりあえずつけた末尾の「00」を「69」で置き換える (前掲のスクリプトは置き換え済)。

12月18日追記:

コメントでチェックサムの計算方法を教えて頂いた。ラトックシステム社は、Raspberry Pi 関連製品に関してはサンプルコードを公開していて、 RPi-IREX 用の赤外線リモコン信号を出力するプログラムに、チェックサムを計算するコードが含まれているとのこと。

このコードを調べてみると、生成多項式が x⁸ + x⁷ + x² + 1 の CRC-8 だった。 CPAN (perl のライブラリ) を使えば、以下のように簡潔に書けてしまう。

use Digest::CRC qw(crc);

sub crc8_calc {
    my ($buf) = @_;
    return crc($buf, 8, 0, 0, 0, 0x85, 0);
}

実を言うと、チェックサムが CRC-8 である可能性は、昨年の段階で真っ先に検討していた。しかし一般的に使われる生成多項式を片っ端から試してみた限りでは計算結果が一致するものはなく、仮に CRC だとしても何らかの目眩ましが施されているのだろうと思い、解析を中断してしまっていた。

いま思えば、CRC-8 の生成多項式は高々 256個しかないわけで、一般的に使われるものだけでなく、とりあえず全てを試してみるべきだった。

というわけで、さっそく上記 crc8_calc を wfirex.pl に組み込んでみた:

#!/usr/bin/perl
use strict;
use warnings;
use Getopt::Std;
use IO::Socket::INET;
use Digest::CRC qw(crc);

my %Ir;
$Ir{'on'} = pack("H*", "221104040504040D040D0404050C050404040504040D04040504040D0404050C0504040D04040504040D040405040404050404040504040D040D0404050C05040404050C0504040D04040504040D0404050404FFFFFF07231005040404050C050C0504040D040405040404050C05040404050C0504040D0404050C05040404050C050404040504040405040404050C050C0504040D04040504040D0404050C05040404050C0504040405");
$Ir{'off'} = pack("H*", "221005040404050C050C0504040D040405040404050C05040404050C0504040D0404050C05040404050C0504040405040404050C050C050C050C0504040D040405040404050C050C05040404050C0504040405FFFFFF07221104040504040D040D0404050C050404040504040D04040504040D0404050C0504040D04040504040D0404050404040504040D040D040D040D0404050C050404040504040D040D04040504040D0404050404");
$Ir{'small'} = pack("H*", "221104040405040D040D0404040D040504040504040D04040405040D0404050C0504040D04040504040D04040405040404050404050C050C050C0504040D04040405040D040D040D04040504040D0404040504FFFFFF08221104040405040D040D0404050C040504040405040D04040405040D0404050C0405040D04040405040D04040504040404050404040D050C050C0504040D04040504040D040D040D04040405040D0404040504");
$Ir{'aoff'} = pack("H*", "211005040404040d0404040d040404040504040c050c040405040404040d040c0405040404040504040405040404040405040404050404040404050c0404050404040405040404040504040c0504040404050404040d040404040504040404050404040c0504040c050c040d040c040d040c04");
$Ir{'study_on'} = pack("H*", "2210050C04050404040405040404050404040405040404050404040D0404040504040405040404050404040D040D040404050404040504040405040C0504040D0404040D040D040C050C0405040C0504040D04040405040404050404040405040404050C050C040D040C050C050C040D040D0404050C040405040404050404040504040C0504040D040C050C050C040D040D0404040D0404050404040504040C050C050C0405040C050C040D040D0404040504FF2E2111040C05040405040404050404040404050404040504040405040C0504040404050404040504040405040D040C040504040405040404050404040D0404050C0405040C050C040D040D0404040D0404050C04050404040504040404050404040504040D040C050C040D040D040C050C040D0404050C040504040405040404050404040D0404040D040D040D040C050C050C0405040C0504040404050404040D040D040C0504040D040C050C050C0405040404FF292111040D04040405040404050404040504040405040404050404040D0404040504040405040404050404040D040D040404050404040504040404050C0405040C0504040D040C050C040D0404050C0405040C05040404050404040504040404050404040D040D040C050C050C040D040C050C0504040D040404040504040405040404050C0504040C050C050C040D040D040C0504040D0404040504040404050C040D040D0404050C040D040C050C0504040404");
$Ir{'study_off'} = pack("H*", "2210040D04050404040504040405040404040504040404050404040D0405040404050404040503050404040D040D040404050404040504040405040C0504040D0404040D040D040C040D0405040C0504040D04040405040404050404040504040405040C050C040D040D040C050C040D040D040C050C04050404040504040405040404050404040D040D040C050C040D040D0404040D0405040404040405040D040D040C0405040C050C040D040D0404040504FF2E2111040D04040405040404050404040504040405040404050404040D0404040504040405040404050404040D040C050404050305040404050404040D0405040C0504040D040C050C040D0404050C0405040C05040404050404040405040404050404040D040D040C050C040D040D040C050C040D040D04040504040405040404050404040504040C050C050C040D040C050C0504040D0404040504040404050C040D040D0404040D040D040C050C0504040404FF292210050C04050404040504040405040404050404040404050404040D0405040404050404040404050404040D040D040404050404040504040405040C0504040D0404040D040D040C050C0405040C0504040D04040405040404050404040405040404050C040D040D040C050C040D040D040D040C050C04050404040405040404050404040504040D040C050C040D040D040D0404040D0404040504040405040D040C040D0405040C040D040D040D0404040504");
$Ir{'study_aoff'} = pack("H*", "2c2b070f0610060f061006050605060f060506050605060406050610060f0605061006050604060506050605060505100610060f06100610060f0610060f060506050605060506040605060506050605060f06100605060f0610060506040605060506050605050506050605061005100610060506040605060506050605050506050610060505100610060505100610060505332d2b0610060f0610061005050605061006050505060506050605060f06100605060f0605060506050605050506050610060f0610061005100610060f06100605060506040605060506050605050506050610060f06050610060f06050605060506050505060506050605060505100610060f06050605060506050505060506050605060f06050610060f06050610060f060506");

sub crc8_calc {
    my ($buf) = @_;
    return crc($buf, 8, 0, 0, 0, 0x85, 0);
}

our ($opt_v, $opt_s);
getopts('vs') || help();
my $ip = shift || help();
my $command = shift || help();

sub get_wfirex {
    my ($ip) = @_;
    my $sock = IO::Socket::INET->new(
        PeerAddr  => $ip,
        PeerPort  => 60001,
        Proto     => "tcp",
        Timeout   => 5,
        );
    if ($sock) {
        print $sock "\xaa\x00\x01\x18\x50";
        my $buf;
        my $flags;
        $sock->recv($buf, 256, $flags);
        my @data = unpack("CCCCCnnnCC", $buf);
        close($sock);
        my $crc = crc8_calc(substr($buf, 3, length($buf) - 4));
        print join(" ", @data) . " crc:$crc\n" if $opt_v;
        return ($data[7], $data[6], $data[5]);
    }
    return undef;
}

sub send_wfirex {
    my ($ip, $ir) = @_;
    my $len = length($ir);
    $ir = "\x11\x00" . pack("n", $len) . $ir;
    my $crc = pack("C", crc8_calc($ir));
    my $sock = IO::Socket::INET->new(
        PeerAddr  => $ip,
        PeerPort  => 60001,
        Proto     => "tcp",
        Timeout   => 5,
        );
    if ($sock) {        
        print $sock "\xaa" . pack("n", $len+4) . $ir . $crc;
        my $buf;
        my $flags;
        $sock->recv($buf, 256, $flags);
        my @data = unpack("CCCCCC", $buf);
        close($sock);
        my $crc = crc8_calc(substr($buf, 3, length($buf) - 4));
        if (@data) {
            print join(" ", @data) . " crc:$crc\n" if $opt_v;
        }
        return $data[5];
    }
    return undef;
}

if ($command eq "get") {
    my ($il, $te, $hu) = get_wfirex($ip);
    if (defined $il) {
        $te /= 10;
        $hu /= 10;
        print "il=$il te=$te hu=$hu\n";
    } else {
        print "wfirex get TIMEOUT $ip\n";
    }
} elsif (defined $Ir{$command}) {
    send_wfirex($ip, $Ir{$command});
}
exit 0;

sub help {
    print <  
opt:   -v   ; verbose
com: get    ; get sensor value
EOF
    print "     " . join(" ", sort keys %Ir) . "\n";
    exit 1;
}

CRC 算出の対象となるペイロードが、私が予想した範囲と 1バイトずれているので注意。つまり私は、「射」 (「赤外線を発射せよ」という命令) がヘッダの一部と考えたが、「射」も CRC 算出の対象となっているので、「射」はヘッダではなくペイロードと考えるべきだろう。 1バイト増えたぶん、末尾の「検」 (チェックサム) はペイロードから外れる。

┌─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
│頭│ペイ長│射│０│デー長│赤外線の波形データ│検│
└─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘
│←ヘッダ→│←─────ペイロード─────→│

すると ←左図のように、「ペイ長」 (ペイロードの長さ) の直後のバイトから「検」 (CRC値) の直前のバイトまでがペイロードということになり、確かにこのほうが自然。「測」 (「計測データを送信せよ」という命令) についても同様。

学習リモコンの赤外線波形データを変換してみた〜 Nature Remo で取得した波形データを PC-OP-RS1 用に変換

hiroaki_sengoku — Mon, 09 Dec 2019 23:47:41 +0000

人感センサ (人の動きを感知するセンサ) 付であることに魅力を感じて IoT な学習リモコン Nature Remo を買ったら、人の動きをトリガーにした IFTTT との連携ができないばかりか、センサの感度もあまりよくなかった。仕方ないので人感センサを新たに買ってみた。

人感センサとしての感度は、だんぜんこの +Style ORIGINAL スマートセンサー(人感) PS-SMT-W01 のほうがいい。 IFTTT と連携できないので他の IoT 機器との連携を考えている場合は注意が必要だが、私は IFTTT をショートカットするので無問題。思わず買い増ししてしまった。

Nature Remo から人感センサを引き算したら、残りは「学習リモコン」ということになるが、そこで思い出したのが 13年前に買ったパソコン用学習リモコン PC-OP-RS1。いま流行りの IoT では無いが、サーバが置いてある部屋で使うのであれば IoT である必要はなく、むしろ PC-OP-RS1 のように (ネットを介さず) USB で直接コントロールできるほうが、赤外線を発射するまでの遅延が少なくてすむ。

学習リモコン PC-OP-RS1 と人感センサ PS-SMT-W01 を組合わせれば Nature Remo は不要？と思ったので押し入れの中から PC-OP-RS1 を発掘した。ところが、家電のリモコンの赤外線を学習させようと、 PC-OP-RS1 の受光部に向けて赤外線を発射しても、 PC-OP-RS1 側では何も受け取っていない様子。 10年くらい使ってなかったから赤外線受光素子が劣化してしまったのか？

赤外線の受光はできないものの、発光は可能みたい。 13年前に書いた Perl スクリプトを使って Nature Remo に向けて赤外線を発射してみると、ちゃんと Nature Remo で波形データを生成できた。ということは、波形データさえ用意できれば今でも使えそう。

ただし、 13年前に PC-OP-RS1 を買ったときは、波形データのフォーマットを知らなくても使えたので、単に PC-OP-RS1 が出力した波形データを 16進数の羅列として perl スクリプトに取り込んだだけ。当時書いた「日記」からスクリプト (の冒頭部分) を引用:

#!/usr/bin/perl
use strict;
use warnings;
use Device::SerialPort;
use Getopt::Std;

my %Ir;
$Ir{'vPower'} = [
    pack("H*", "ffffffffffffffffffffff0700000000007ef0831ff8c00f7e00003f00800ffc00003f00801f00c00700f00300f8c10f7c00003f00801f00e00700f0831f00c00f7ee0033ff8c10ffc00003ff00100fc00007e00001f00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000"),
    ];
$Ir{'aPower'} = [
    pack("H*", "ffffffff0f00000080ff000000fc030000f01fc07f000000fe01fc070000e03f000000ff01fe030000f01f000080ff00fe010000f80fe03f000000ff000000fc07f01fc03f000000ff01fc07f80fe03f807f00ff01fc03f80f0000c07f00ff00fe03f80fe01fc07f00ffffffff07000000c03f000000ff010000f80fe01f000000ff00fe030000f01f0000807f00ff010000f80f0000c03f80ff000000fc07f00f0000c07f000000fe03f807f01f000080ff00fe01fc07f00fe03f80ff00fe01fc070000e03f807f00ff01fc03f80fe03f80ffffffff01000000f01f0000000000000000000000000000000000feffff"),
    ];

　．．．以下略　．．．

スクリプト中「vPower」はビデオテープレコーダ (VTR) の電源をオン/オフする赤外線のデータ。「aPower」は (おそらく) エアコンのオン/オフ。後に続く 16進数の羅列が赤外線の波形データ。どちらの家電もすでに無く (VTR なんてすでに死語？)、そのリモコンも捨ててしまった。なのでこのスクリプトが (今でも) ちゃんと機能するかは確認のすべがない。

とりあえず vPower の 16進数を 2進数で表示してみる:

senri:~ $ perl -e 'print unpack("b*", pack("H*", "ffffffffffffffffffffff0700000000007ef0831ff8c00f7e00003f00800ffc00003f00801f00c00700f00300f8c10f7c00003f00801f00e00700f0831f00c00f7ee0033ff8c10ffc00003ff00100fc00007e00001f00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000"))."\n"'
111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111100000000000000000000000000000000000000000000001111110000011111100000111111000000111110000001111110000011111100000000000000000111111000000000000000001111100000011111100000000000000001111110000000000000000011111100000000000000000111110000000000000000011111100000000000000000111111000001111110000001111100000000000000000111111000000000000000001111110000000000000000111111000000000000000001111110000011111100000000000000000111111000001111110000001111100000011111100000111111000001111110000001111110000000000000000111111000000111110000000000000000011111100000000000000000111111000000000000000001111100000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

おお、 (なんとなく ^^;) 赤外線の波形データっぽい。 2進数で表示すると、最初の 91個の「1」と続く 46個の「0」の連続を除けば、「1」は 5〜6個続くのに対し、「0」は 5〜6個か、15〜17個続く。これは赤外線リモコンの通信フォーマットにおける 1T (5〜6個) および 3T (15〜17個) の区間に対応するのだろう。ということは T (変調単位) は 2進数 5.5個くらいに対応する、つまり 2進数 1個は 100μ秒くらいなのだろう。

ちなみに unpack("B*", ...) (descending bit order) も試してみたのだが、「"b*"」(ascending bit order) のほうが赤外線の波形データっぽかったので、「"b*"」と仮定して作業を進めた。とりあえず 2進数に変換してみる、みたいな試行錯誤を 1行スクリプトでサクっと書けてしまえるのは perl ならでは。さいきんあまり人気がない perl だが、この手の試行錯誤をするときには今でも一番ではなかろうか？

いっぽう Nature Remo の赤外線波形データはこんな感じ:

senri:~ $ curl -i -X GET "http://Remo-XXXXXX.local/messages" -H "Accept: application/json" -H "X-Requested-With: curl" -H "Expect: "
HTTP/1.0 200 OK
Server: Remo/1.0.77-g808448c
Content-Type: application/json

{"format":"us","freq":37,"data":[3357,1717,385,1305,377,468,386,460,386,460,387,459,383,463,385,462,382,463,383,463,383,462,384,465,381,465,379,1306,386,463,382,460,385,465,381,467,381,459,385,462,384,462,377,1312,386,1309,384,459,387,462,382,460,386,460,385,461,385,462,385,1306,385,461,384,1307,384,461,386,1306,402,1291,399,1291,382,1307,388,456,404,1290,401,443,403,1287,407,440,402,445,401,443,386,462,400,445,384,463,382,464,381,464,384,1306,401,1292,383,1302,409,1285,402,1289,383,1309,383,1306,387,1304,379,1312,407,1285,402,443,405,441,386,460,403,443,385,460,404,442,385,464,403,440,404,1289,405,1285,404,1282,388,1304,409,1282,390,1301,406,441,386,1306,407,436,410,441,401,440,406,443,385,1304,407,1284,404,1287,405,441,386,1305,408,1287,404,1285,385,1304,407,441,383,462,389,40199,3376,1697,384,1306,407,441,402,442,407,440,384,465,400,443,405,442,383,460,385,464,384,461,401,445,402,441,404,1291,400,446,384,461,400,446,381,463,383,466,399,444,402,444,383,1304,407,1287,401,444,384,460,404,442,407,439,406,442,403,441,404,1287,386,460,403,1289,400,445,403,1287,407,1282,409,1285,385,1307,400,444,405,1285,404,442,404,1289,402,442,405,441,401,444,386,459,404,442,405,441,403,443,404,442,407,1286,405,1288,398,1286,406,1285,409,1283,404,1287,407,1286,401,1294,406,1284,401,1288,401,446,381,462,402,445,401,444,402,444,384,462,383,466,398,442,407,1286,401,1288,403,1288,404,1288,403,1288,401,1290,407,439,404,1284,406,441,404,441,409,436,408,439,407,1285,406,1285,403,1289,400,446,402,1288,403,1287,405,1284,404,1286,409,437,406,444,404,39760,3379,1697,402,1288,404,442,405,441,401,444,407,439,406,441,401,446,402,441,407,439,402,445,406,441,401,443,401,1290,405,437,404,446,405,441,402,441,402,442,406,441,403,441,404,1290,402,1290,400,446,404,439,407,439,406,439,404,442,404,442,406,1288,401,442,402,1290,385,462,401,1289,401,1290,404,1288,399,1288,404,441,386,1306,402,446,402,1287,403,446,401,442,402,444,401,445,404,441,402,444,402,444,402,446,400,1290,398,1290,402,1287,385,1309,404,1287,400,1289,403,1292,401,1283,390,1302,387,1304,404,445,384,460,408,436,405,442,385,462,402,443,404,441,404,442,385,1306,404,1287,402,1292,383,1307,401,1289,404,1290,400,443,405,1282,388,461,406,439,404,446,384,461,383,1303,404,1289,385,1303,405,442,404,1288,405,1286,404,1287,402,1290,403,442,406,440,405]}

Nature Remo に向けて赤外線を発射した後、 http でアクセスすれば JSON 形式で波形データを返してくれる。で、この波形データの意味は？と思う間もなく答が見つかってしまった。つまんない。

data配列の各要素は、赤外線ONの期間、OFFの期間、ONの期間、OFFの期間、、、、を表している。厳密には、これは38kHzの変調をデコードしたあとの結果である。実際にはONの期間は38kHzの変調信号になっている。
Nature Remoに存在しないボタンを登録するから引用

ぱっと見 400前後の数値が多いなぁと思ったが、 1T 区間に対応するわけね、納得。ざっと見た感じ「赤外線ONの期間」のほうが「OFFの期間」より短めになっている感じがしたので、前者は 85 で割り算し、後者は 115 で割り算してみた。この「商」(割り算した結果) の個数だけ 2進数の 1 と 0 を並べ、 16進数に変換すればオシマイ。

Nature Remo 形式から PC-OP-RS1 形式への変換スクリプト:

#!/usr/bin/perl
use strict;
use warnings;

my @data = (3357,1717,385,1305,377,468,386,460,386,460,387,459,383,463,385,462,382,463,383,463,383,462,384,465,381,465,379,1306,386,463,382,460,385,465,381,467,381,459,385,462,384,462,377,1312,386,1309,384,459,387,462,382,460,386,460,385,461,385,462,385,1306,385,461,384,1307,384,461,386,1306,402,1291,399,1291,382,1307,388,456,404,1290,401,443,403,1287,407,440,402,445,401,443,386,462,400,445,384,463,382,464,381,464,384,1306,401,1292,383,1302,409,1285,402,1289,383,1309,383,1306,387,1304,379,1312,407,1285,402,443,405,441,386,460,403,443,385,460,404,442,385,464,403,440,404,1289,405,1285,404,1282,388,1304,409,1282,390,1301,406,441,386,1306,407,436,410,441,401,440,406,443,385,1304,407,1284,404,1287,405,441,386,1305,408,1287,404,1285,385,1304,407,441,383,462,389,40199,3376,1697,384,1306,407,441,402,442,407,440,384,465,400,443,405,442,383,460,385,464,384,461,401,445,402,441,404,1291,400,446,384,461,400,446,381,463,383,466,399,444,402,444,383,1304,407,1287,401,444,384,460,404,442,407,439,406,442,403,441,404,1287,386,460,403,1289,400,445,403,1287,407,1282,409,1285,385,1307,400,444,405,1285,404,442,404,1289,402,442,405,441,401,444,386,459,404,442,405,441,403,443,404,442,407,1286,405,1288,398,1286,406,1285,409,1283,404,1287,407,1286,401,1294,406,1284,401,1288,401,446,381,462,402,445,401,444,402,444,384,462,383,466,398,442,407,1286,401,1288,403,1288,404,1288,403,1288,401,1290,407,439,404,1284,406,441,404,441,409,436,408,439,407,1285,406,1285,403,1289,400,446,402,1288,403,1287,405,1284,404,1286,409,437,406,444,404,39760,3379,1697,402,1288,404,442,405,441,401,444,407,439,406,441,401,446,402,441,407,439,402,445,406,441,401,443,401,1290,405,437,404,446,405,441,402,441,402,442,406,441,403,441,404,1290,402,1290,400,446,404,439,407,439,406,439,404,442,404,442,406,1288,401,442,402,1290,385,462,401,1289,401,1290,404,1288,399,1288,404,441,386,1306,402,446,402,1287,403,446,401,442,402,444,401,445,404,441,402,444,402,444,402,446,400,1290,398,1290,402,1287,385,1309,404,1287,400,1289,403,1292,401,1283,390,1302,387,1304,404,445,384,460,408,436,405,442,385,462,402,443,404,441,404,442,385,1306,404,1287,402,1292,383,1307,401,1289,404,1290,400,443,405,1282,388,461,406,439,404,446,384,461,383,1303,404,1289,385,1303,405,442,404,1288,405,1286,404,1287,402,1290,403,442,406,440,405);
my $str = "";
my $bit = 1;
for my $d (@data) {
    if ($bit) {
        $str .= $bit x ($d / 85);
        $bit = 0;
    } else {
        $str .= $bit x ($d / 115);
        $bit = 1;
    }
}
$str = unpack("H*", pack("b*", $str)). "\n";
print "$str\n";

1行スクリプトに書けなくもないが、まあ無理に 1行にしなくても、このくらいならソッコーで書ける。やっぱり perl が一番 :-)。

実行してみると ↓ こんな感じ。波形データを PC-OP-RS1 形式に変換して初めて気付いたが、 80個以上の 0 が連なる区間 (2進数だと 320個以上、つまり 32ミリ秒以上の空白) があり、 3つの波形データに分けられることが分かる。

senri:~ $ ./irconv.pl
ffffffff7f00e001f0f0f0f07878787878787878003c3c3c3c3c1e1e1e000f80c7c3c3c3c3c303e0e101f0f00078003c001e008f07c0e301f0783c1e1e0f0f0f0f8007c003e001f00078003c001e000f8007c0e3f1f078783c3c1e000f8007c003e001f000783c001e8fc7e301f00078003c1e000f8007c003e0f1f000000000000000000000000000000000000000000000000000000000000000000000000000000000000000e0ffffffff0f003c001e8fc7c3e3f1f0f0f0783c001e0f8f8787c7e301f000783c3c1e8fc703e0e101f078003c001e000f80c703e0f100783c1e8fc7e3f178003c001e000f8007c003e001f00078003c001e0f8fc7e3e1e1f10078003c001e000f8007c0e301f0783c1e0f8007c003e0f10078003c001e008fc703000000000000000000000000000000000000000000000000000000000000000000000000000000000000f8ffffffff03000f80c7e3f1783c1e8fc7e3f100783c1e8fc7e3f10078003c1e8fc7e3f100783c001e1e000f8007c003e0f100783c001e8fc7e3f1783c1e000f8007c003e001f00078003c001e000f80c7c3e3f1f0783c1e000f8007c003e001f000783c001e1e8f8707c003e001f078003c001e000f80c7e301

というわけで、上記「変換スクリプト」をちょこっと書き直して、赤外線信号が表現しているデータを表示するようにしてみる。 NECフォーマットでも、家製協(AEHA, 家電製品協会)フォーマットでも、赤外線OFFの期間が 1T のとき「0」で、 3T のとき「1」だから、赤外線ONの期間は無視して、赤外線OFFの期間が 1000以上の時は 1 で、以下なら 0、そして 3000以上なら信号の切れ目。

Nature Remo 形式から家製協(AEHA)フォーマットへの変換スクリプト:

#!/usr/bin/perl
use strict;
use warnings;

my @data = (3357,1717,385,1305,377,468,386,460,386,460,387,459,383,463,385,462,382,463,383,463,383,462,384,465,381,465,379,1306,386,463,382,460,385,465,381,467,381,459,385,462,384,462,377,1312,386,1309,384,459,387,462,382,460,386,460,385,461,385,462,385,1306,385,461,384,1307,384,461,386,1306,402,1291,399,1291,382,1307,388,456,404,1290,401,443,403,1287,407,440,402,445,401,443,386,462,400,445,384,463,382,464,381,464,384,1306,401,1292,383,1302,409,1285,402,1289,383,1309,383,1306,387,1304,379,1312,407,1285,402,443,405,441,386,460,403,443,385,460,404,442,385,464,403,440,404,1289,405,1285,404,1282,388,1304,409,1282,390,1301,406,441,386,1306,407,436,410,441,401,440,406,443,385,1304,407,1284,404,1287,405,441,386,1305,408,1287,404,1285,385,1304,407,441,383,462,389,40199,3376,1697,384,1306,407,441,402,442,407,440,384,465,400,443,405,442,383,460,385,464,384,461,401,445,402,441,404,1291,400,446,384,461,400,446,381,463,383,466,399,444,402,444,383,1304,407,1287,401,444,384,460,404,442,407,439,406,442,403,441,404,1287,386,460,403,1289,400,445,403,1287,407,1282,409,1285,385,1307,400,444,405,1285,404,442,404,1289,402,442,405,441,401,444,386,459,404,442,405,441,403,443,404,442,407,1286,405,1288,398,1286,406,1285,409,1283,404,1287,407,1286,401,1294,406,1284,401,1288,401,446,381,462,402,445,401,444,402,444,384,462,383,466,398,442,407,1286,401,1288,403,1288,404,1288,403,1288,401,1290,407,439,404,1284,406,441,404,441,409,436,408,439,407,1285,406,1285,403,1289,400,446,402,1288,403,1287,405,1284,404,1286,409,437,406,444,404,39760,3379,1697,402,1288,404,442,405,441,401,444,407,439,406,441,401,446,402,441,407,439,402,445,406,441,401,443,401,1290,405,437,404,446,405,441,402,441,402,442,406,441,403,441,404,1290,402,1290,400,446,404,439,407,439,406,439,404,442,404,442,406,1288,401,442,402,1290,385,462,401,1289,401,1290,404,1288,399,1288,404,441,386,1306,402,446,402,1287,403,446,401,442,402,444,401,445,404,441,402,444,402,444,402,446,400,1290,398,1290,402,1287,385,1309,404,1287,400,1289,403,1292,401,1283,390,1302,387,1304,404,445,384,460,408,436,405,442,385,462,402,443,404,441,404,442,385,1306,404,1287,402,1292,383,1307,401,1289,404,1290,400,443,405,1282,388,461,406,439,404,446,384,461,383,1303,404,1289,385,1303,405,442,404,1288,405,1286,404,1287,402,1290,403,442,406,440,405);
my $str = "";
my $bit = 1;
my $skip = 2;
for my $d (@data) {
    next if $skip-- > 0;
    if ($bit) {
        $bit = 0;
    } else {
        if ($d > 3000) {
            print unpack("h*", pack("b*", $str)). "\n";
            $str = "";
            $skip = 2;
        } elsif ($d > 1000) {
            $str .= "1";
        } else {
            $str .= "0";
        }
        $bit = 1;
    }
}
print unpack("h*", pack("b*", $str)). "\n";

実行結果を以下に示す。 3つの波形は同じデータ「10010305fa00ff30cf2cd3」(低 nybble が先) の繰り返しだった。前掲した PC-OP-RS1 形式への変換スクリプトで得た波形データは 454バイトもあったが、 3つの波形が同じなら最初の 1波形 124バイトだけでよいことになる。 PC-OP-RS1 は一度に送ることができる赤外線データが 240バイトという制限があるので、 1波形のみ送ることにした。

senri:~ $ ./iraeha.pl
10010305fa00ff30cf2cd3
10010305fa00ff30cf2cd3
10010305fa00ff30cf2cd3

以下は、 PC-OP-RS1 で赤外線の送信を行うスクリプト。 -d オプションで PC-OP-RS1 のデバイスを指定する。受光部分が壊れてしまったので、赤外線を学習する機能はない。前述したような方法 (Nature Remo 等の学習リモコンで元データを生成して変換) で赤外線の波形データを作成し、連想配列 %Ir に設定する。

緊張しながらこのスクリプトを実行「./pc-op-rs1 -d /dev/PC-OP-RS1 off」すると...
みごと日立LED照明器具 LEC-AHS810K が消灯した。ということは日立製作所のメーカ識別コードが 0x1001 ってこと？どこかに家製協のメーカ識別コード (カスタマーコード) の一覧って無いだろうか？ちなみに「全灯」ボタンは「10010305fa00ff20df2cd3」だった。

#!/usr/bin/perl
use strict;
use warnings;
use Getopt::Std;
use Device::SerialPort;

my %Ir;
$Ir{'on'} = pack("H480", "ffffffff7f00e001f0f0783c1e8fc7e3f1783c001e1e8fc7e3f178003c001e1e8fc7e3f100783c001e1e000f8007c003e0e101f0f00078783c1e8fc7e3f10078003c001e000f8007c003e001f078003c1e0f8fc7c303e0e101f00078003c001e000f80c703e0e1e1f1f00078003c001e1e000f8007c003e0e1f1");
$Ir{'off'} = pack("H480", "ffffffff7f00e001f0f0f0f07878787878787878003c3c3c3c3c1e1e1e000f80c7c3c3c3c3c303e0e101f0f00078003c001e008f07c0e301f0783c1e1e0f0f0f0f8007c003e001f00078003c001e000f8007c0e3f1f078783c3c1e000f8007c003e001f000783c001e8fc7e301f00078003c1e000f8007c003e0f1f0");

our ($opt_v, $opt_d, $opt_c);
getopts("vd:c:") || help();
defined $opt_d || die "option -d is needed\n";

my $port = new Device::SerialPort($opt_d) || help();
$port->user_msg(1);
$port->error_msg(1);
$port->baudrate(115200);
$port->databits(8);
$port->parity("none");
$port->stopbits(1);
$port->handshake("none");
$port->read_const_time(100); # 0.1 sec
$port->read_char_time(5);
send_ir($port, "\x69");
recv_ir($port, 1, 3);

my $ch = 1;
if ($opt_c) {
    if ($opt_c =~ /^[1-4]$/) {
        $ch = $opt_c;
    } else {
        help();
    }
}

while ($_ = shift @ARGV) {
    defined $Ir{$_} || help();
    send_ir($port, "\x74")
        && recv_ir($port, 1, 3) eq "\x59"
        && send_ir($port, pack("C", 0x30+$ch))
        && recv_ir($port, 1, 3) eq "\x59"
        && send_ir($port, $Ir{$_})
        && recv_ir($port, 1, 3) eq "\x45"
        && next;
    die;
}
$port->close;
exit 0;


sub send_ir {
    my ($port, $data) = @_;
    $port->write($data);
    print STDERR "send: ", unpack("H*", $data), "\n" if $opt_v;
}

sub recv_ir {
    my ($port, $len, $timeout) = @_;
    my $i = 0;
    my $j = 0;
    my $data;
    while ($i < $len) {
        my ($l, $d) = $port->read(1);
        if ($l > 0) {
            $data .= $d;
            $i += $l;
            $j = 0;
        } else {
            $j++;
            if ($timeout > 0 && $j > $timeout) {
                print STDERR "TIMEOUT to read $len byte\n";
                return "";
            }
        }
    }
    print STDERR "recv: ", unpack("H*", $data), "\n" if $opt_v;
    return $data;
}

sub help {
    print STDERR <...
opt:   -d    device (MUST)
       -c     channel (1..4)
       -v         verbose
EOF
    print "com: ", join(" ", sort keys %Ir), "\n";
    exit 1;
}

IFTTT に登録できないのでお蔵入りになってた Eco Plugs RC-028W & CT-065W が、UDP パケットを送るだけでコントロールできた！

hiroaki_sengoku — Thu, 28 Nov 2019 11:06:45 +0000

IoT 機器の多くが、専用のスマホアプリだけでなく Googleアシスタントや Amazonアレクサからコントロールできる。しかし、いちいち音声でコントロールするのはメンドクサイ (なぜ音声以外の方法でもコントロールできるようにしないのか？)。出かけるときに毎回「行ってきま〜す」などと Googleアシスタントに呼び掛けるのは、いかがなものかと思う。外出を勝手に検知して家電を適切にコントロール (例えば電気ポットの電源を切る) してくれるほうがずっといい。

IoT 機器を IFTTT に登録すると、自前のプログラムからコントロールできるようになる。 IoT 機器は Googleアシスタントでコントロールするより、自前のプログラムでコントロールするに限る。例えば自宅の Wi-Fi LAN にスマホが繋がっているかプログラムで監視し、繋がってるスマホがいなくなったら留守になったと判断して、自動的に電気ポットの電源を切れば、電気ポットのコンセントを抜いたかどうか出先で心配せずに済む。あるいはコンセントを抜くのを忘れて寝てしまい、翌朝電気ポットのお湯が熱いままなのを見て愕然とするより (先月の電気使用量が 600kWh だったので驚いた)、部屋が暗いときは自動的に電源が切れている方がいい (これはプログラムを書かなくても IFTTT だけで実現できる)。

というわけで持ってる IoT 機器を片っ端から IFTTT に登録したのだけど、 IFTTT に登録できない IoT 機器も残念ながら若干ある。いまどき IFTTT に登録できない IoT 機器に何の意味があるのだろう？ (今なら絶対に買わない) と思うのだけど、 IFTTT の便利さを知る前に買ってしまったのだから後悔先に立たず。 IFTTT の便利さを知ってからは、お蔵入りになっていた。

Eco Plugs もそんな「使えない」IoT 機器の一つ。当時としては安価だった (今ならもっと安い) ので Walmart で購入してしまった。 Googleアシスタントや Amazonアレクサには登録できるのに、肝心の IFTTT に登録できない。

といって通信プロトコルを解析しようにも、いまどきの IoT 機器はクラウド (ベンダが運用するサーバ) と https で通信するので調べる取っ掛かりがない。最後の手段、分解するしかないのか？

ところがググっていると、 Eco Plugs は平文で通信しているという投稿を見つけた。 Eco Plugs はクラウドに登録しなくても、同一 LAN セグメントならスマホアプリでコントロールできるが、同一 LAN 内では平文の UDP パケットを飛ばしているらしい。

ありがたいことに Eco Plugs をコントロールする JavaScript プログラムが GitHub に公開されていた。 JavaScript は文法もロクに知らない (^^; のだけど、見よう見まねで perl で書き直してみる:

#!/usr/bin/perl
use strict;
use warnings;
use Getopt::Std;
use IO::Socket::INET;
our ($opt_v);
(getopts('v') && @ARGV == 3) || &help;
my ($ip, $id, $on) = @ARGV;

my $state = 0x0100;
$state = 0x0101 if $on eq "on";
my $buf = pack("H260", 0);
# Byte 0:3 - Command 0x16000500 = Write, 0x17000500 = Read
substr($buf, 0, 4) = pack("N", 0x16000500);
# Byte 4:7 - Command sequence num - looks random
substr($buf, 4, 4) = pack("N", rand(0xffffffff));
# Byte 8:9 - Not sure what this field is - 0x0200 = Write, 0x0000 = Read
substr($buf, 8, 2) = pack("n", 0x0200);
# Byte 16:31 - ECO Plugs ID ASCII Encoded - 
substr($buf, 16, 16) = $id;
# Byte 116:119 - The current epoch time in Little Endian
substr($buf, 116, 4) = pack("L", time());
# Byte 124:127 - Not sure what this field is - this value works, but i've seen others 0xCDB8422A
substr($buf, 124, 4) = pack("N", 0xCDB8422A);
# Byte 128:129 - Power state (only for writes)
substr($buf, 128, 2) = pack("n", $state);

my $sock = IO::Socket::INET->new(PeerAddr => $ip, PeerPort => 80,
    Proto => 'udp', Timeout => 1) || die;
my $flags;
print unpack("H*", $buf) . "\n" if $opt_v;
print $sock $buf;
$sock->recv($buf, 1024, $flags);
print unpack("H*", $buf) . "\n" if $opt_v;

# Byte 10:14 - ASCII encoded FW Version - Set in readback only?
my $fwver = substr($buf, 10, 5);
# Byte 48:79 - ECO Plugs name as set in app
my $name = substr($buf, 48, 32);
$name =~ s/\0*$//;
printf("%s (ver %s)\n", $name, $fwver);

sub help {
    print <   
opt:   -v           ; verbose
EOF
    exit 1;
}

長さ 130 バイトの UDP パケット (変数 $buf) を作って Eco Plugs へ送信している (print $sock $buf;) だけなので、いたってシンプル。ユーザ認証もないので LAN 内なら誰でもコントロールできる。

Eco Plugs の IP アドレス (第1引数) と、 Eco Plugs の ID 「ECO-XXXXXXXX」(第2引数, XXXXXXXX は MACアドレスの第3〜6オクテット, ただし 16進数の A〜F は大文字限定)、および「on」あるいは「off」の 3引数を付けて、この perl プログラムを実行すると、該当 Eco Plugs をオン/オフし、 Eco Plugs の名前 (スマホアプリで設定できる。以下の例では「potplug」) と、ファームウェアのバージョン (以下の例では「1.6.3」) を表示する。

senri:~ $ ecoplugs -v 192.168.15.123 ECO-01234567 on
16000500940c163b020000000000000045434f2d303132333435363700000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000a625df5d00000000cdb8422a0101
160005000000163b0000312e362e330045434f2d30313233343536370000000000000000000000000000000000000000706f74706c7567000000000000000000000000000000000000000000000000003031323334353637000000000000000000000000000000000000000000000000a8e23b7ea625df5d00000000cdb8422a
potplug (ver 1.6.3)

「-v」オプションを付けた場合、最初に表示される行が Eco Plugs へ送った長さ 130バイトの UDP パケット (260桁の 16進数)、 2行目が Eco Plugs から返ってきた長さ 128バイトの UDP パケット (256桁の 16進数)。第1引数で指定した IP アドレスが Eco Plugs のものでなかった場合、あるいは第2引数で指定した ID が間違っている場合など、応答が返ってこない時は待ち続ける。 ID の 16進数において A〜F が小文字だと応答しないので注意。

Eco Plugs の RC-028W (屋外用) および CT-065W (屋内用) で動作を確認したが、おそらく同シリーズの他の機器でも使えるだろう。 Woods の WiON (スマホアプリが Eco Plugs そっくり) でも使えるらしい。

12月4日追記:

Eco Plugs からの応答 UDP パケットは、確実を期すためか同じものが 2度送られてくる。複数の Eco Plugs デバイスを続けてコントロールするときなど、 2度目のパケットを次のデバイスからの応答と誤認する恐れがあるので、応答パケットのシーケンス番号を確認すべき。

ここでシーケンス番号とは、 UDPパケットの 6, 7バイト目にランダムな値を設定してデバイスへ送信すると、その応答パケットには同じ値が設定されて返ってくる。参考にした eco.js では「Byte 4:7 - Command sequence num」と書かれているが、実際の応答パケットでは 4, 5バイト目は常に 0が返ってきた。

また、こちらから送った UDP パケットが届いていない可能性、あるいは UDP パケットが正しく届いていても、何らかの原因でオン/オフが正しく切り替わっていない可能性もある。 Eco Plugs をオン/オフするパケットを送った後は、現在のオン/オフ状態を問合わせるパケットを送って、正しい状態になっているか確認すべき。

さらに、前掲した perl スクリプトでは、 Eco Plugs から応答が帰ってこない場合は待ち続けるが、実地に使う場合は待ち続けて止まってしまっては困るので、当然タイムアウト処理も必要になる。

以上 3点を修正した perl スクリプトは以下の通り:

#!/usr/bin/perl
use strict;
use warnings;
use Getopt::Std;
use IO::Socket::INET;
our ($opt_v);
(getopts('v') && @ARGV == 3) || help();
my ($ip, $id, $on) = @ARGV;

my $com;
if ($on eq "on") {
    $com = 1;
} elsif ($on eq "off") {
    $com = 0;
} elsif ($on eq "get") {
    $com = -1;
} else {
    help();
}
my $buf = ecoplug_send($ip, $id, $com);
if (! $buf) {
    print "ecoplug_send timeout\n";
    exit 1;
}
# Byte 10:14 - ASCII encoded FW Version - Set in readback only?
my $fwver = substr($buf, 10, 5);
# Byte 48:79 - ECO Plugs name as set in app
my $name = substr($buf, 48, 32);
$name =~ s/\0*$//;
my $ret = ord(substr($buf, 129, 1));
printf("%s (ver %s) %s\n", $name, $fwver, $ret);
exit 0;

sub ecoplug_send {
    my ($ip, $id, $com) = @_;
    my $sock = IO::Socket::INET->new(
        PeerAddr => $ip, PeerPort => 80,
        Proto => 'udp', Timeout => 1) || return undef;
    my $seq;
    my $buf;
    for (;;) {
        $seq = rand(0x10000);
        $buf = ecoplug_packet($id, $com, $seq);
        printf("SEND %04x %s\n", $seq, unpack("H*", $buf)) if $opt_v;
        print $sock $buf;
        my $retry = 3;
        $SIG{'ALRM'} = sub {};
        do {
            my $flags;
            alarm 1;
            my $ret = $sock->recv($buf, 1024, $flags);
            alarm 0;
            return undef unless $ret;
            printf("RECV %04x %s\n", unpack("n", substr($buf, 6, 2)),
                   unpack("H*", $buf)) if $opt_v;
        } until substr($buf, 6, 2) eq pack("n", $seq) || $retry-- <= 0;
        last if $com < 0;
        $com = -1;
    }
    $sock->close;
    return $buf;
}

sub ecoplug_packet {
    my ($id, $com, $seq) = @_;
    my $buf;
    if ($com == 1) {                # on
        $buf = pack("H260", 0);
        # Byte 0:3 - Command 0x16000500 = Write
        substr($buf, 0, 4) = pack("N", 0x16000500);
        # Byte 8:9 - Not sure what this field is - 0x0200 = Write
        substr($buf, 8, 2) = pack("n", 0x0200);
    } elsif ($com == 0) {        # off
        $buf = pack("H260", 0);
        substr($buf, 0, 4) = pack("N", 0x16000500);
        substr($buf, 8, 2) = pack("n", 0x0200);
    } elsif ($com == -1) {        # get
        $buf = pack("H256", 0);
        # Byte 0:3 - Command 0x17000500 = Read
        substr($buf, 0, 4) = pack("N", 0x17000500);
        # Byte 8:9 - Not sure what this field is - 0x0000 = Read
    } else {
        return undef;
    }
    # Byte 6:7 - Command sequence num - looks random
    substr($buf, 6, 2) = pack("n", $seq);
    # Byte 16:31 - ECO Plugs ID ASCII Encoded - 
    substr($buf, 16, 16) = $id;
    # Byte 116:119 - The current epoch time in Little Endian
    substr($buf, 116, 4) = pack("L", time());
    # Byte 124:127 - Not sure what this field is
    substr($buf, 124, 4) = pack("N", 0xCDB8422A);
    if ($com == 1) {                # on
        # Byte 128:129 - Power state (only for writes)
        substr($buf, 128, 2) = pack("n", 0x0101);
    } elsif ($com == 0) {        # off
        substr($buf, 128, 2) = pack("n", 0x0100);
    }
    return $buf;
}

sub help {
    print <   
opt:   -v           ; verbose
EOF
    exit 1;
}

私の自宅では、実際にこの perl スクリプトを使って、留守中および就寝中は自動的に電気ポットの電源が切れるようにしている。

UEFI ブートでキーボードが無いと GRUB がハングするバグを修正してみた

hiroaki_sengoku — Wed, 04 Sep 2019 12:21:30 +0000

遅ればせながら手元の PC を MBR ブートから UEFI ブートに切り替えた。ハードディスクの最初の 512バイト MBR (Master Boot Record) を読み込んで起動するのが MBR ブート。 Windows だと 2TB 超のディスクは MBR ブートできない (Linux ならブート可能)。 2TB では手狭になってきたのが切り替えを決意した理由だが、ついでに Linux 専用マシンも PC のファームウェアが対応しているものは UEFI ブートに切り替えた。

UEFI (Unified Extensible Firmware Interface) だと、普通の FAT32 ボリュームにブートローダのファイルを置いておくだけなので、わざわざ MBR を書き換えたりするより簡単だし分かりやすい。 PC が起動しなくなった、などのトラブルはよくあるが、トラブル発生時は気が急くし時間的余裕がないことも多いので、トラブル時の作業は簡単であればあるほど、分かりやすければ分かりやすいほど好ましい。

UEFI ブートに切り替えて 1ヶ月ほど経ったある日、 CPU を換装するために落としていた PC の電源を入れたら GRUB のメニュー画面でフリーズしたので私も凍り付いた。 CPU の性能をむやみに上げると、マザーボードとのミスマッチが起りがち。せっかく買った新しい CPU が問題を起こしたのかと思った。電源ボタンを長押しして強制的に電源を落とす。

BIOS 設定を確認するためにキーボードをつないで再度電源を入れてみる。設定に何の問題もない。続いて GRUB を立ち上げる。問題無く立ち上がる。 Linux を起動する。問題無い。さっきのフリーズは何だったのだろう？

この時は因果関係に気付かなかったが、キーボードをつないでいないと GRUB 2.04 (および最新版の 2.05 も) がメニュー画面のカウントダウンでハングする (最初の秒を表示したまま止まる)。 PC を再起動するときは、たいていキーボードをつないでいるので正常に起動し、この症状は見たことがなかった。

実はこの時も、なぜキーボードをつないでいなかったかというと明確な理由はない。 CPU 換装後の動作確認なのだからキーボードをつないでおくべきだと思うのだけど、たまたまつなぐのを忘れていただけかも。 Web で「headless GRUB hang bug UEFI without keyboard」などを検索しても似た症例がほとんど見つからないのは、キーボードをつながずに起動させる人がほとんどいないから？

とはいえ、何台もあるサーバそれぞれにキーボードをつないでいては邪魔である。意図して再起動するときはキーボードをつなぐなり KVM スイッチ (Keyboards, Video monitors, Mice Switch) を切り替えてキーボードが効く状態にするのが通常だが、トラブルや Watchdog タイマーで勝手に再起動したとき、あるいは遠隔から再起動させたときに、立ち上がらずにフリーズしてしまったら非常に困る。不測の再起動に備えて、急遽テンキーをつないでおくことにした。

GRUB がキー入力を検知する状態であれば、画面表示の有無自体は関係なくハングする。逆に言うと、 GRUB がキー入力を検知しなければ、例えば grub.cfg でキー入力を読む命令が無ければ (menuentry 等が無ければ) ハングしない。例えば grub.cfg が次のように特定の Linux を起動するだけなら、正常に起動できる。

insmod all_video
insmod part_gpt
insmod search_label
search --no-floppy --label --set=root /
linux /boot/linuz-4.19.69-x86_64 root=LABEL=/ resume=LABEL=swap ro
initrd /boot/initz-4.19.69-x86_64
boot

もちろんこれでは GRUB を使う意味がないが、少なくとも問題が GRUB のキー入力関連にあることが分かった。同じ PC、同じ GRUB でも、 UEFI ブートではなく MBR ブートなら、キーボードをつながなくてもハングしない (MBR ブート専用の USB メモリを作って確認した。末尾の「おまけ」参照)。また、UEFI ブートであっても UEFI ファームウェアによってはハングしない場合もあると思われる (未確認)。が、少なくとも私の PRIMERGY MX130 S2 では確実に再現する。

というわけで、問題の所在はおおむね絞り込めたので、 GRUB のソースコードを読み始めた。並行して facebook に、ことの顛末を書込んだ。

すると野中尚道さんから grub-core/tem/efi/console.c が怪しそう、とのヒントを頂いた。ありがたい！なにぶん EFI のソースコードを読むのは初めてなので、この時点ではまだ流れを追いきれていなかった。 efi/console.c の grub_console_getkey まわりを重点的に読んでみる。

grub-core/tem/efi/console.cのget_keyで key_exとkey_conを呼び分けている処理が失敗しているような気がします。 key_exの方はオプション機能なので実装有無を確認してるのですが
野中尚道さんのコメントから引用

なるほど確かに grub_console_getkey_ex は、 grub_efi_open_protocol の返り値が NULL で無いとき (key_ex の実装が有るとき) に限り呼び出されているが、 grub_console_getkey_con には対応するものがない。 key_con は必ず実装されているから確認不要？でも、キーボードをつないでいない場合はどうなる？ key_ex の有無を確認するコード:

text_input_ex_guid = GRUB_EFI_SIMPLE_TEXT_INPUT_EX_PROTOCOL_GUID;
        ...
text_input = grub_efi_open_protocol(grub_efi_system_table->console_in_handler,
                                    &text_input_ex_guid,
                                    GRUB_EFI_OPEN_PROTOCOL_GET_PROTOCOL);

をマネして、 key_con の有無を確認するコードをでっち上げてみる。単に「_EX_」の部分を取り除いただけだが、キーボードをつないでいるか否かを正しく検出しているようだ。

text_input_guid = GRUB_EFI_SIMPLE_TEXT_INPUT_PROTOCOL_GUID;
text_input = grub_efi_open_protocol(grub_efi_system_table->console_in_handler,
                                    &text_input_guid,
                                    GRUB_EFI_OPEN_PROTOCOL_GET_PROTOCOL);

あとはキーボードの有無に応じて grub_efi_console_input_init の返り値を変えるだけ。 grub_efi_console_input_init が 1 (非ゼロ?) を返せば、 GRUB は grub_console_getkey を呼ばなくなるようだ。

以上をまとめると、次のようなパッチになった:

diff --git a/grub-core/term/efi/console.c b/grub-core/term/efi/console.c
index 4840cc5..f2be32f 100644
--- a/grub-core/term/efi/console.c
+++ b/grub-core/term/efi/console.c
@@ -207,7 +207,12 @@ grub_efi_console_input_init (struct grub_term_input *term)
                                       GRUB_EFI_OPEN_PROTOCOL_GET_PROTOCOL);
   term->data = (void *)text_input;
 
-  return 0;
+  if (text_input) return 0;
+  grub_efi_guid_t text_input_guid = GRUB_EFI_SIMPLE_TEXT_INPUT_PROTOCOL_GUID;
+  text_input = grub_efi_open_protocol(grub_efi_system_table->console_in_handler,
+                                      &text_input_guid,
+                                      GRUB_EFI_OPEN_PROTOCOL_GET_PROTOCOL);
+  return text_input == NULL;
 }
 
 static int

わずか 6行だが、これで GRUB がハングしなくなった。

2019年9月5日追記:

このブログを書いているときに、野中尚道さんから次のパッチが送られてきた:

--- console.c.orig        2019-09-04 20:13:31.098813831 +0900
+++ console.c        2019-09-04 20:17:17.726231536 +0900
@@ -144,6 +144,9 @@
   grub_efi_status_t status;
 
   i = grub_efi_system_table->con_in;
+  if (i == NULL)
+    return GRUB_TERM_NO_KEY;
+
   status = efi_call_2 (i->read_key_stroke, i, &key);
 
   if (status != GRUB_EFI_SUCCESS)

試してみたところ、キーボードをつながなくてもハングしなかった。つまり GRUB ハングの正体は、NULL ポインタに対する参照、通称「ぬるぽ」だったことになる。もしこの「con_in」ポインタが NULL になることが UEFI 的に想定外であるなら、問題は UEFI ファームウェア側にあるといえる。

とはいえファームウェアにバグがあっても、ある程度は GRUB 側でフォローしてもらえるとありがたい。古い PC だとファームウェアの更新が期待できないことも多いのだから。

おまけ:

Windows 10 セットアップ用の USB メモリに Ubuntu 他を同居させる方法:

Windows 10 がトラブった時に、セットアップ USB メモリ (インストールメディア) があると、修復したりシステムの復元ができるので大変便利だが、 Windows 専用の USB メモリを常に持ち歩くのはメンドクサイ。

そこで、セットアップ USB メモリに GRUB と Ubuntu をインストールすれば、 Windows だけでなく Linux マシンの復旧にも役立つツールになる。いろいろ入れても 8GB にも満たないので、私は持っている USB メモリのほとんど全てに入れてある。小型の USB メモリに仕込んで、財布の中などにいれて常に持ち歩きたい (GRUB がハングした等のトラブル時に慌てなくて済む)。

まず、 Windows 10 のダウンロードページから「ツールを今すぐダウンロード」をクリックして、インストールメディア (USB フラッシュドライブ) を作成する。

次に、作成した USB メモリ内の「\EFI\BOOT\BOOTX64.EFI」ファイルの名前を「BOOTWIN.EFI」(任意の名前でも可) に変更する。このとき USB メモリの「ボリュームシリアル番号」をメモしておく。

C:\Users\sengoku>dir h:
 ドライブ H のボリューム ラベルは ESD-USB です
 ボリューム シリアル番号は 8005-7BC9 です

 H:\ のディレクトリ

2019/07/09  11:41               128 AUTORUN.INF
2019/08/31  14:31              BOOT
        ...

そして、この USB メモリを Linux マシンへ挿入して GRUB をインストールする。ついでに MBR にも GRUB をインストールしておくと、 UEFI に対応していない PC でも使える。

mount /dev/sde1 /mnt/usb
grub-install --target i386-pc \
        --boot-directory=/mnt/usb/EFI --removable /dev/sde
grub-install --target x86_64-efi --efi-directory /mnt/usb \
        --boot-directory=/mnt/usb/EFI --removable

ここでは USB メモリのデバイス名を「sde」としているが、 Linux マシンへ挿入したときに割当てられる名称で読み替える。

Ubuntu など好きな Linux DVD の ISO イメージを、 USB メモリ内の適当なディレクトリへコピーする。ついでに EFI シェル Shell_Full.efi を入れると便利。もちろん、 USB メモリの容量の許す限り何を入れても良い。

mkdir /mnt/usb/iso
cp -a ubuntu-14.04.4-desktop-amd64.iso /mnt/usb/iso/
cp -a Shell_Full.efi /mnt/usb/EFI/BOOT/

テキストファイル「\EFI\grub\grub.cfg」を作成し、以下の内容を書込む。冒頭の「set uuid="〜"」には、前述した「ボリュームシリアル番号」を記入する。前述した「BOOTWIN.EFI」を別のファイル名にしたのであれば、そのファイル名を「chainloader /efi/boot/bootwin.efi」の部分に記入する。

set uuid="8005-7BC9"
set imgdevpath="/dev/disk/by-uuid/$uuid"
insmod all_video

menuentry "[loopback] Ubuntu 14.04.4 desktop amd64" {
        set isofile="/iso/ubuntu-14.04.4-desktop-amd64.iso"
        loopback loop $isofile
        linux (loop)/casper/vmlinuz.efi boot=casper iso-scan/filename=$isofile
        initrd (loop)/casper/initrd.lz
}
menuentry "EFI Windows 10 Setup" {
        chainloader /efi/boot/bootwin.efi
}
menuentry "EFI Shell" {
        chainloader /efi/boot/Shell_Full.efi
}

Ubuntu のバージョンによって、 linux のパラメータが微妙に変わってくるので、 Ubuntu DVD 内の「\boot\grub\grub.cfg」を確認する。例えば ubuntu-ja-18.04.3-desktop-amd64 の場合は次のようになる:

        linux (loop)/casper/vmlinuz boot=casper iso-scan/filename=$isofile 
        initrd (loop)/casper/initrd.lz

ZenFone3 で撮影した写真ファイル内の、位置情報が壊れている Exif データを修復するコードを書いてみた

hiroaki_sengoku — Fri, 11 Aug 2017 13:09:54 +0000

昨年発表された ASUS のハイエンドスマホ ZenFone 3 Deluxe ZS570KL の購入時の OS は Android 6.0 Marshmallow だが、この OS (UL-Z016-WW-4.12.40.1698) の標準のカメラアプリには、撮影した写真の位置情報が他のアプリで参照できないというバグがあった。

つまり、カメラの設定で「場所サービス」を「オン」にすると、撮影した場所 (GPS などの位置情報) を写真ファイルに付加する (Exif データ) が、この位置情報に問題があって、他のアプリで写真を見ても位置情報が表示されない。例えば撮影した写真を Google フォトへアップロードしても、撮影場所が表示されない。

この写真を Google フォトからダウンロードしてみれば、 Exif データ内に位置情報が保持されていることが分かるし、アプリによってはこの位置情報を参照できるものもある。

例えば OS 標準の「ギャラリー」アプリで見ると、位置情報が正しく保持されているように見える。例えば、御成町の交差点で撮影したこの写真を「ギャラリー」で見ると (右図 ⇒ ZenFone のスクリーンショット)、場所が「鎌倉市, 御成町」と正しく表示される。

位置情報を正しく表示できるアプリがある以上、バグではなく仕様 (Exif のバージョンの違い？) の可能性もある。このとき私は、この写真の位置情報を参照できないアプリは、アプリ側にも問題があるのだろうと思ってしまった。おそらく開発元でも同様の理由で、このバグが見逃されてしまったのだろう。

そしてもし仕様なら、 Google フォトで撮影場所が表示されない問題も、そのうち (Google 側で) 解決されるのだろうと思って放置してしまった。ところが先日バンクーバーに行ったことで、これは仕様などではなく、紛れもないバグだったことを確信した。

つまり、日本や ZenFone 製造元である台湾など、「東経」な地域では正しい場所が表示されるが、バンクーバーなど「西経」な地域だと全くかけ離れた場所が表示されてしまうということ。

例えば、バンクーバーで撮った写真を「ギャラリー」で見ると (右図 ⇒ ZenFone のスクリーンショット)、場所が「内モンゴル, フルンボイル, オロチョン自治旗, 中華人民共和国」などと広大な草原の真っ只中な場所が表示されてしまう (データが無いためか地図が真っ白, そもそも「自治旗」なんて行政単位は初めて見た)。「49.288132,123.130722」という位置座標を、「49.288132,-123.130722」に直してみる (経度をマイナスにしてみる) と、正しい座標になることから、「西経」で撮影しても「東経」で記録してしまうバグであることが分かった。

もちろん、このバグは現行の Android 7.0 Nougat では修正されているが、 Android 7.0 へ更新する前に撮影した写真ファイルの位置情報は (当然のことながら) 壊れたままなので不便このうえない。

そこで Android 6.0 の時に撮影した写真ファイルの位置情報を、修正してみることにした。まずは Exif データに保持された位置情報の何が問題なのか調べてみる。

「Exif データの構造」という検索語でググってみると、いくつか解説ページが見つかる。ありがたいことに「Exif データにアクセスするコード」まで見つかった (libexif project のような本格的なライブラリだと読むのが大変)。長い解説文よりも動く簡潔なコードの方が話が早い。

コードを読みつつ、まずは動かしてみて、 ZenFone 3 で撮影した写真ファイルの何がマズイのか調べてみる。

senri:~ $ gcc -o exif sample_main.c exif.c
senri:~ $ ./exif P_20170701_100640_vHDR_Auto.jpg
[P_20170701_100640_vHDR_Auto.jpg] createIfdTableArray: result=5

{0TH IFD}
 - DateTime: [2017:07:01 10:06:40]
 - GPSInfoIFDPointer: 22232 
 - Model: [ASUS_Z016D]

        …… 中略 ……

{GPS IFD}
 - GPSLongitude: 123/1 7/1 505923/10000 
 - GPSLatitudeRef: [N]
 - GPSProcessingMethod: [ASCII]
 - GPSAltitudeRef: 200/100 
 - GPSLatitude: 49/1 17/1 172751/10000 
 - GPSLongitudeRef: [se]

        …… 後略 ……

Longitude は経度、 Latitude は緯度。 GPSLongitude や GPSLatitudeRef のことをタグと呼び、タグの値を保持するのが Exif データの役割。

Exif では緯度・経度の値を、 3つの分数で表現する。例えば「GPSLongitude: 123/1 7/1 505923/10000」というのは、タグ GPSLongitude の値が「123/1 度 7/1 分 505923/10000 秒」、すなわち撮影場所が「経度 123 度 7 分 50.5923 秒」であることを意味する。

そして GPSLatitudeRef: [N] は、タグ GPSLatitudeRef の値が「N」つまり北緯 (North) であることを表わす。では、 GPSLongitudeRef: [se] はどういう意味なんだろうか？普通に考えればここは [se] ではなく西経 (West) の [W] ではなかろうか？

[se] に何か特別な意味でもあるのかと思ってググってみたが、何も見つからず。単なるバグ？どうやったらこんなバグを作り込めるのだろう？

ちなみに GPSLongitudeRef: [se] は Exif データ内では次のような 12バイトのデータ (「タグフィールド」と呼ぶ) になる:

00 03    00 02    00 00 00 03    73 65 00 00

最初の 2バイト「00 03」が、タグ GPSLongitudeRef を表わし (タグそれぞれに ID が割当てられている。GPSLongitudeRef は 3, GPSLongitude は 4 といった具合)、

次の 2バイト「00 02」が、タグの値のタイプが ASCII 文字列であることを表わす。

次の 4バイト「00 00 00 03」が、タグの値の長さ、ここでは ASCII 文字列の長さが 3文字 (終端文字 00 を含む) であることを表わし、

最後の 4バイト「73 65 00 00」が、タグの値である ASCII 文字列「se」と終端文字 00。最後の 00 は単なる穴埋め。

タグの値が 4バイトに収まらないときは、実際のデータ格納場所を指し示すポインタ (ファイル内のオフセット) が、この最後の 4バイトに格納される。

御成町の交差点で撮影した写真の位置情報も同様に調べてみた。

{GPS IFD}
 - GPSLongitude: 139/1 32/1 576664/10000 
 - GPSLatitudeRef: [N]
 - GPSProcessingMethod: [ASCII]
 - GPSAltitudeRef: 200/100 
 - GPSLatitude: 35/1 19/1 27825/10000 
 - GPSLongitudeRef: [se]

やっぱりタグ GPSLongitudeRef の値が [se] になっている。どうりで「西経」でも「東経」と同じになってしまうわけだ。

ちなみにタグ GPSAltitudeRef は海抜 (altitude) が海水面より上 (0) か下 (1) かを表わす。 0 か 1 以外の値はダメ。この Exif データでは RATIONAL タイプ (32ビット符号無し整数 2個で分数を表わす) になっている (正しくは BYTE タイプ)。タグ GPSAltitude と混同しているのか？高度 2m というのも意味不明だけど。まあ、タグ GPSAltitudeRef を参照するアプリが手元にないので、とりあえず放置。

というわけで原因が分かった。位置情報の [se] を [W] (西経の場合。東経ならば [E]) へ書き換えればうまくいきそう。つまり、前述の 12バイトのタグフィールドの場合なら、次のように書き換えればよい。

00 03    00 02    00 00 00 03    73 65 00 00

↓

00 03    00 02    00 00 00 02    57 00 00 00

つまり、データの長さ (終端文字を含む ASCII 文字列の長さ) を 3 から 2 へ書き換え、 ASCII 文字列を「se」から「W」 (西経の場合) へ書き換える。要は、書き換えるべきタグフィールドが写真ファイル内のどこにあるかさえ分かれば、それを読み込んで書き換えてファイルへ書き戻すだけ。というわけで、サクっと書いてみた。わずか 150行足らず。

書き換えるべきタグフィールドがどこにあるか調べるのは、「Exif データにアクセスするコード」を流用させて頂いたので、あっと言う間に書けた (このブログを書く方が遥かに時間がかかっている)。

ありがとうございます＞ DSAS 開発者の部屋のみなさま, とくに tanabe さま

東経か西経かという情報は写真ファイルには無いので、西経の場合は -W オプションを指定する (デフォルトは東経)。例えばバンクーバーで撮った写真を一つのディレクトリにまとめておいて、

senri:~/Vancouver $ fix_GPSInfo -W *

といった感じで一括修復できる。修復の必要がないファイル (他のカメラで撮影した写真ファイルや、位置情報を含んでいない写真ファイル、および動画など写真以外のファイル等) は影響を受けない。手元の写真ファイルはこれで全て修復できるのだけど、 Google フォトにアップロード済みの写真はどうしよう？いちど全部消してアップロードし直せばいいのだろうけど、あまりに枚数が多すぎるなぁ...

決してBusyにならない SIP 留守番電話機を Perl で作ってみた〜用件が録音されるとメールに添付して送信

hiroaki_sengoku — Thu, 24 Feb 2011 10:52:20 +0000

IP 電話でいろいろ遊ぼうとすると定番は Asterisk だが、いかんせん牛刀すぎる。個人的に VoIP を使う場合 PBX の必要はなく、留守番電話や転送ができれば充分。というわけでまずは留守番電話の機能をさくっと Perl で書いてみた (わずか 93行)。

sip_user: hiroaki_sengoku
sip_passwd: xxxxxxxx
sip_domain: ekiga.net
answer_rings: 30
answer_sound: /home/tam_ekiga/answer.raw
voicemail_time: 60
voicemail_dir: /home/tam_ekiga/LOCAL/voicemail

設定ファイル answer_machine.conf を ↑ のような感じで書いておいて、留守番電話スクリプト answer_machine を実行する:

answer_machine --conf /home/tam_ekiga/answer_machine.conf

sip:hiroaki_sengoku@ekiga.net に着信があると、応答メッセージを流した後、相手の音声を録音し、 /home/tam_ekiga/LOCAL/voicemail ディレクトリに 8kHz サンプリングの 8bit μ-law 形式で保存する。あとはこのディレクトリを監視するプログラムを走らせて、新着録音をメールで送信するようにしておけばよい。

次に IPKall を利用 (申込には米国の IP アドレスからアクセスする必要あり) して電話番号をもらう。米国ワシントン州リンデンの番号 +1-360-526-6699 が割当てられた。上記 SIP 留守番電話が待受けている sip:hiroaki_sengoku@ekiga.net を、この電話番号の転送先として IPKall に登録すれば、 Google Voice もどき (^^;) の出来上がり。この番号に電話すると、上記スクリプトが応答し (上記設定ファイルに answer_rings: 30 と書いてある通り、 30秒間呼び出しを続けないと応答しない)、何かメッセージを吹き込めば mp3 形式の音声データが添付されたメールが私宛に届く。

この仕掛けを作った晩の翌日未明 3:16 に、さっそく着信があり録音データが添付されたメールが届いた。発信者の電話番号は +1-877-347-3760 だった (+1-877- は米国のフリーダイヤル)。メールで送られて来た録音データがコレ。英語が苦手な私にはちょっとつらい (^^;) が、再生速度を遅めにして一生懸命聞き取ってみる:

Hello, this is a message for Korety Martin. If you are not Korety Martin, please hang up and call 877-347-3760 to remove this phone number from our records. If you continue to listen to this message, you are acknowledging that you are Korety Martin. This message contains personal and private information. There will now be a three second pause.

This is EOCCA, A Collection Agency. This is an attempt to collect a debt. Any information obtained will be used for that purpose. Please contact us about this important business matter at 877-347-3760. When calling please reference account number 9.

真面目にディクテーションするのが馬鹿馬鹿しくなるような、絵に描いたような詐欺電話 (*_*)。「Collection Agency」は債権回収会社のこと。「EOCCA, A Collection Agency」で検索してみると、いっぱい出てくる。借金の心当たりがある人 (のうち 1% くらい?) は、つい騙されて折り返し電話をかけてしまうのか。日本とかだと人海戦術で電話をかけまくるらしいが、自動で電話をかけまくるのが米国流なのか? 電話版スパムメールといった感じ?

なお、最後がしり切れとんぼのような感じがするが、これは録音時間を 60秒間に制限しているため (上記設定ファイルの voicemail_time: 60)。

- o -

以下は、 Perl プログラミングに興味があるかた向け:

CPAN に登録されている Net::SIP モジュールには、サンプルプログラムとして留守番電話スクリプト answer_machine.pl が含まれている。ところが、このスクリプトだと着呼時にすぐオフフック (＝受話器を持ち上げて電話に出る) してしまう。ふつー留守番電話といえば、呼び出し時間 (つまりベル^H^H着メロを鳴らす時間) を設定できるものだと思っていたが、残念ながらこのスクリプトにはそのような機能はない。これでは留守じゃなくても留守番電話が先に出てしまう！

着呼時にすぐオフフックするのではなく、一定秒数待ってからオフフックするようにスクリプトを修正するなんて、 sleep 命令を書き加えるだけだろうと思うかもしれないが、さにあらず。 Net::SIP は非同期処理が中心なので、全ての処理はイベントループ Net::SIP::Dispatcher::Eventloop から呼び出される仕組になっている。つまり各処理の中で勝手に sleep とかすると、他の処理が全部滞ってしまう。逆に言うと、非同期処理なので一つのプロセスで複数の通話を扱える。つまり決してお話し中 (Busy) にならない。

answer_machine.pl から引用:

use Net::SIP;
use Net::SIP::Util ':all';
        ...
$ua->listen(
        init_media => [ \&play_welcome, $welcome,$hangup,$savedir ],
        ...
        }
);
$ua->loop;

着呼待ちのためのスクリプトはたったこれだけ。 $ua->listen で、オフフックしたときに呼び出される Callback (init_media) として \&play_welcome (関数リファレンス) を登録し、 $ua->loop でイベントループに入る。着呼すると即オフフックして関数 play_welcome を引数 $welcome, $hangup, $savedir 付で呼び出す。 play_welcome は、留守番電話の応答メッセージ (「ただいま留守にしております。ご用件のあるかたはピーッという音の後にお話下さい」など) を送信し、相手が話す「用件」を録音する関数。

answer_machine.pl では自前の関数 play_welcome を定義して init_media へ登録しているが、 Net::SIP::Simple::RTP モジュール内にも media_send_recv という (応答メッセージを) 送信して、 (相手の用件を) 録音する関数が定義されている。これを使えば、

$ua->listen(
    init_media => $ua->rtp('media_send_recv', 'answer.raw', 1, 'out.raw'),
    );

などと書くこともできる。ここで answer.raw は 8kHz サンプリングの 8bit μ-law 形式の音声データのファイル名で、これが応答メッセージとして再生され、ファイル out.raw に同形式で相手の用件が録音される。

したがって、呼び出し時間が常に 0 秒で構わなければ、

#!/usr/bin/perl
use Net::SIP;
my $user = 'hiroaki_sengoku';
my $pass = 'xxxxxxxx';
my $domain = 'ekiga.net';
my $ua = Net::SIP::Simple->new(
    outgoing_proxy => $domain,
    registrar => $domain,
    domain => $domain,
    from => $user,
    auth => [ $user, $pass ],
    ) || die;
$ua->register;
$ua->listen(
    init_media => $ua->rtp('media_send_recv', 'answer.raw', 1, 'out.raw'),
    );
$ua->loop;

これだけで留守番電話として機能する。

まったくもって簡潔すぎて、どこをどう変更すれば呼び出し時間を確保できるのか、これだけでは見当もつかないが、関数 $ua->rtp (init_media に登録された Callback) が呼び出された段階で既にオフフックしてしまっているわけで、時すでに遅しということだけは分かる。どうやってオフフックする前に一定秒数待つ処理 (以下、Ringing と略記) を割り込ませばよいだろうか?

Net::SIP のドキュメントにはオフフック前の挙動については一切言及がないので、仕方なく Net::SIP::Simple の listen のソースを読んでみる:

sub listen {
        my Net::SIP::Simple $self = shift;
        my %args = @_;

        # handle new requests
        my $receive = sub {
                my ($self,$args,$endpoint,$ctx,$request,$leg,$from) = @_;
                ...
                # new invite, create call
                my $call = Net::SIP::Simple::Call->new( $self,$ctx,{ %$args });
                my $cb = UNIVERSAL::can( $call,'receive' ) || die;
                ...
                # setup callback on context and call it for this packet
                $ctx->set_callback([ $cb,$call ]);
                $cb->( $call,$endpoint,$ctx,undef,undef,$request,$leg,$from );
        };

        $self->{endpoint}->set_application([ $receive, $self,\%args ]);
}

set_application は、 endpoint (Net::SIP::Endpoint, 通信端点) とユーザとをつなぐ application を endpoint に登録するための関数。例えば着呼したら着信音を鳴らすとか、ユーザが受話器を持ち上げたら着呼処理を行なうとか、通信相手の音声をスピーカに出力してユーザに伝えるとか、等々を行なう application (Callback) を登録する。

ここで登録される application である $receive (無名関数へのリファレンス) の処理内容を追っていくと、実質的には Net::SIP::Simple::Call->receive を呼び出しているだけ。で、この Net::SIP::Simple::Call->receive こそが実際の着呼処理、すなわち通信相手からの INVITE リクエストに対して「SIP/2.0 200 OK」を返す処理を行なっている。

ということはつまり、 Net::SIP::Simple::Call->receive の呼び出しが行なわれる前に Ringing 処理を割り込ませばよい。いろいろ方法はあると思うが、 endpoint に登録されている application を、 Ringing を行なう無名関数で置き換えてみた:

    my $sub = $ua->{endpoint}->{application}->[0];
    $ua->{endpoint}->{application}->[0] = sub {
        my ($self, $args, $endpoint, $ctx, $request, $leg, $from) = @_;
        my $meth = $request->method;
        if ($meth eq 'INVITE') {
            my $res = $request->create_response('180', 'Ringing');
            $endpoint->new_response($ctx, $res, $leg, $from);
            $self->add_timer($rings, [$sub, $self, $args,
                                      $endpoint, $ctx, $request, $leg, $from]);
        } else {
            $endpoint->close_context($ctx);
        }
    };

これで着呼時にオフフックせずに、 Ringing を行なうことになる。つまり、「180 Ringing」レスポンスを返し、一定秒数 ($rings 秒) 後にオフフックさせるために add_timer を呼ぶ。 add_timer は、第一引数 ($rings) で示す秒数後に、第二引数 ([$sub, ...]) を Callback として呼び出すタイマーを登録する関数。第二引数に、元々 endpoint に登録されていた application へのリファレンス $sub を指定すれば、 $rings 秒後にオフフックして留守番応答が行なわれる。

Google Voice で電話する「V字発信」 Perl スクリプトを書いてみた〜日本へは 2円/分、米国内は年内無料

hiroaki_sengoku — Mon, 14 Feb 2011 00:27:01 +0000

2009年に米国内でサービス開始した Google Voice は、 2010年6月から以前のような「招待制」ではなくなり、米国内からであれば設定するだけですぐ利用できるようになった。近いうちに米国外へも展開すると思われるが、日本は後回しになりそうな気がする (Android 版 Skype が使えるようになったのも世界中で一番最後だったし)。米国内限定といっても、米国内に IP アドレスと電話番号があれば利用できるようなので試しに使ってみた。

米国内 IP アドレスは Linode VPS (Virtual Private Server, 仮想専有サーバ) を契約しているので既に持っている。この VPS 上で PPTP (Point to Point Tunneling Protocol) デーモンを立ち上げておけば、 Windows 標準機能の「仮想プライベートネットワーク」 (VPN) で接続して、米国内からのアクセスを装うことができる。 WWW アクセスだけなら proxy server を立ち上げておくだけで充分かと思ったが、 proxy 経由のアクセスかどうか Google サーバ側で見ているらしく、 proxy 経由では Google Voice は利用できない。

なお、いったん Google Voice の設定を済ませて Google Number を確保してしまえば、米国内国外を問わず任意のマシンから Google Voice を利用可能。つまり Google Number を確保するときのみ、米国内の IP アドレスからアクセスする必要がある、ということ。

米国内の電話番号は、無料で電話番号を割当ててくれるサービスがあるのでそれを利用する。私は IPKall を利用した。こちらも米国内の IP アドレスからアクセスする必要があるが、 Google Voice とは異なり米国内の proxy server を経由するだけで登録できる。 SIP フォン (VoIP 電話) のアドレスと、メールアドレスを登録すると、ワシントン州の電話番号を一つ割当て、それをメールで教えてくれる。割当てられた電話番号に着呼すると、登録した SIPフォンへ転送してくれる仕掛け。ただ、米国は電話代が安すぎるためかイタ電が多いのがちょっと困りもの。いたずら電話に困っている人がよほど多いのか、 WhoCallsMe.com, Who Called Us, PhoneOwner.info, white pages, Location Lookup など、かかってきた電話番号を調べるサービスがいくつもある。

維持費用無しで米国の電話番号を持てるのは大変ありがたいが、 30日間サービスを利用していないと登録が無効になってしまう (IPKall の場合)。

IPKall Signup
**ABSOLUTELY FREE**
Washington state phone number to your IP phone.
...(中略)...
Accounts that are inactive for 30 days will be terminated for non-use.
IPKall Signup から引用

「inactive」というのが、 (1)通話実績がないことを意味するのか、 (2)着呼だけでも「active」と見做されるのか、あるいは (3)登録情報を更新するだけでもよいのかは不明。

仮に (1) だとすると、毎月日本から国際電話をかけて通話実績を作らなければならず、とても面倒だしお金もかかる。そこで Google Voice を使って通話実績を作ることを考えた。自動で発呼できれば手間もかからず番号を維持できる。しかも 2011年中 Google Voice は米国内宛の通話が無料らしいので発呼の実験し放題。

Java や Python などから Google Voice をアクセスする非公式な Google Voice API が発表されているが、公式ではないので Google が仕様変更すると使えなくなる恐れあり。「非公式 API」のコードを見てみると、内容的にはとても単純であるように見える。この程度なら自分で一から書いた方が Google の仕様変更への追随も即座にできるし、 Java や Python よりは Perl で書きたかったというのもあって、さくっと書いてみた。わずか 58行、しかも後述するように follow_meta_redirect のバグ対策で 21行ほど要してるので、実質だとわずか 27行。

Google Voice で通話するには、いわゆる「V字発信」を行なう。つまり電話をかけようとする自分の側と通話先である相手側との両方に対して Google から電話をかけ、両者を繋いで通話する。自分の側の電話はあらかじめ登録してあるものから選ぶ。

Google Number を取得済の場合は、 Google Voice ページにアクセスすると左上のロゴの下に「Call」ボタンがあって、押すと
← のようなウィンドウが現れる。

「Number to call」に通話先の電話番号、「Phone to call with」に登録してある自分の電話のうちどれを選ぶかを指定し、「Connect」ボタンを押す。自分の電話の電話番号の代わりに、 (登録済であれば) Google Talk や Gizmo5 のアカウントを指定することもできる。

すると、まず自分の電話 (あるいは Google Talk や Gizmo5) に対して Google から発呼が行なわれる。電話に出ると、次に Google は通話先の番号に対して発呼を行なう。呼び出し中は呼び出し音が自分の電話から聞こえ、相手が出ればそのまま通話できる。

以上を、ブラウザで操作する代わりに、 Perl スクリプトから行なえばよい。
まず Google Voice にログインする:

my $mech = WWW::Mechanize->new();
$mech->get("https://www.google.com/voice");
$mech->success || die "Fail to access\n";
my $res = $mech->submit_form(
    form_id => "gaia_loginform",
    fields => {
        Email => $user,
        Passwd => $pass,
    }
    );
$res->is_success || die "Fail to login\n";

「WWW::Mechanize」は、ブラウザでの操作を簡単にスクリプト化できる便利な Perl モジュール。「ページを開く」「ボタンを押す」「リンクをたどる」等々、ブラウザ操作をずらずら書くだけで自動化が実現できてしまう。混雑時は何度もリロードしないとアクセスできないチケット販売サイト等で、どうしてもチケットを購入したいときに威力を発揮する(うそ)。

最初に "https://www.google.com/voice" をアクセスすると、 Google アカウントのログインページが表示される。 HTML ソースを見ると、


        ...

        ...

        ...

        ...

などとなっているので、 ID が "gaia_loginform" である form について、「Email」フィールドに gmail アドレス、「Passwd」フィールドにパスワードを入力して、「Sign in」ボタンを押せばよいことが分かる。この操作をそのままスクリプトで記述して、

my $res = $mech->submit_form(
    form_id => "gaia_loginform",
    fields => {
        Email => $user,
        Passwd => $pass,
    }
    );

などと書けばよい。もちろん変数「$user」「$pass」には、あらかじめそれぞれ「gmail アドレス」「パスワード」を代入しておく。

大変便利な WWW::Mechanize モジュールだが、画竜点睛を欠くことに meta refresh に対応していない。すなわち、「Sign in」ボタンを押すと、 Google サーバから次のようなレスポンスが返ってくるが、

Redirecting
        ...


        ...

「 sub follow_refresh { my ($mech) = @_; my $content = $mech->content; my $p = HTML::TokeParser->new(\$content) || return $content; while (my $token = $p->get_token) { if ($token->[0] eq 'S' && $token->[1] eq 'meta') { if (defined $token->[2] && ref $token->[2] eq 'HASH') { if (defined $token->[2]->{'http-equiv'} && $token->[2]->{'http-equiv'} =~ /^refresh$/io) { if (defined $token->[2]->{'content'} && $token->[2]->{'content'} =~ m|^(([0-9]+);\s*)*url\=(\'?)(.+)\3$|io) { $mech->get($4); return $mech->content; } } } } } return $content; }

URL が「'」で囲われているときは、その「'」を取り除いて $mech->get するだけ。この関数を呼び出すことにより、上記 meta タグで指定された URL へ遷移できる。

こうして遷移したページには、以下のような部分がある:

Google Voice では、このように隠しフィールド (type="hidden") を使って「_rnr_se」の値を引き回しているようだ。この値は Google Voice で電話をかける際にも必要なので、保存しておく:

my $content = &follow_refresh($mech);
$content =~ m/\]*\svalue=\"(.*)\"/
    || die "Fail to get _rnr_se\n";
my $rnr_se = $1;

以上で Google Voice へのログインが完了。

次に、 Google Voice ページの「Connect」ボタン (前述) を押したとき、どのようなリクエストが Google サーバへ送られるか調べる。ブラウザの挙動を模倣する Perl スクリプトを書けば、ブラウザで操作する代わりに Perl スクリプトで発呼を行なわせることができるはず。

どんなリクエストがサーバへ送られるか調べるには、 Live HTTP headers アドオンが便利 (FireFox の場合)。実際に調べてみるとこんな感じ:

POST /voice/call/connect/ HTTP/1.1
Host: www.google.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; ja; rv:1.9.2.13) Gecko/20101203 Firefox/3.6.13
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: ja,en-us;q=0.7,en;q=0.3
Accept-Encoding: gzip,deflate
Accept-Charset: Shift_JIS,utf-8;q=0.7,*;q=0.7
Keep-Alive: 115
Connection: keep-alive
Content-Type: application/x-www-form-urlencoded;charset=utf-8
Referer: https://www.google.com/voice?pli=1
Content-Length: 146
Cookie: (省略)
Pragma: no-cache
Cache-Control: no-cache

outgoingNumber=360469zzzz&forwardingNumber=253802yyyy&subscriberNumber=undefined&phoneType=2&remember=0&_rnr_se=3W%2FC7p9ElNW6H%2BLdP0ndD9EIek4%3D

POST リクエストの本文 (Content) に、自分の電話番号「253802yyyy」 (一部伏字、以下同様) と通話先電話番号「360469zzzz」が指定されていることが分かる。前述した「_rnr_se」の値も指定されている。

あとは同じリクエストを送信する Perl スクリプトを書くだけ:

$mech->post("https://www.google.com/voice/call/connect/",
            Referer => "https://www.google.com/voice/",
            Content => {
                outgoingNumber   => $call,
                forwardingNumber => $home,
                subscriberNumber => "undefined",
                phoneType        => 2,        # 7:gizmo, 9:gtalk
                remember         => 0,
                _rnr_se          => $rnr_se
            });
$mech->success || die "Fail to call\n";

地デジ MPEG-2 TS の PCR/PTS/DTS ラップアラウンド (PCR Wrap-around) 問題を回避して ffmpeg で PS 変換できるようにしてみた

hiroaki_sengoku — Mon, 20 Sep 2010 23:13:34 +0000

(地上)デジタルTV 放送を Linux サーバで予約録画しまくるようになった今日このごろ、たまに失敗するのが気になっていた。失敗といっても、録画した MPEG-2 TS (Transport Stream) ファイルを VLC で再生する分には問題がないが、 ffmpeg を使って MPEG-2 PS (Program Stream) フォーマットへ変換しようとすると途中で映像が止まってしまう (TS 読み込みに失敗しているので他のフォーマットへの変換もおそらく無理)。

おそらく TS のデータに何らかの誤りがあって ffmpeg が映像データを読むのをそこで止めてしまうためだろうと思っていた。そりゃ放送なんだからノイズが混じることもあるだろうと思い込んでいたのだが、よほど電波状況が悪くない限りエラー補正が効くだろうから、ノイズが原因というのはありそうもない話。

なぜ PS へ変換したいかといえば、 TS のままだとファイルサイズが大きすぎる (2時間の映画番組とかだと 12GB を超える) ので、 PS へ変換し (CM カットなどの編集を行なうときは PS の方が便利)、さらに MPEG-4 などへ変換してサイズを小さくしたいから (もちろん保存する必要がない番組は見たらすぐ消す)。ところが PS への変換に失敗した番組は TS のまま保存せざるを得ず、そういうファイルが増えてきて、 2TB のハードディスクもだんだん手狭になってきた。

そこで、何が原因で TS の読み込みに失敗しているのか、まずは調べてみようと思ったのだが、いかんせんファイルがデカすぎる。 12GB もあるとファイルの内容をダンプするのもままならない。そこで変換が失敗する近辺のデータだけ抜き出して詳しく調べてみようと考えた。 MPEG-2 TS の仕様を調べてみると、 PCR (Program Clock Reference) なるタイムスタンプが 100msec 以下の間隔で MPEG-2 TS には埋め込まれているらしい。問題の TS ファイルは、 2時間の番組中、先頭から 1時間35分41秒ほど経過したあたりで読み込みに失敗するので、 PCR の値を手がかりにその近辺のデータを抜き出そうと考えた次第。

まずは PCR の値を表示する perl スクリプト tsdump.pl を作ってみた (後述する tsrenum.pl に -v オプションを与えることによって同じ出力が得られる)。

% ./tsdump.pl -v < 133000_GR23.ts
0008c4a PCR 24:55:00.570 8073051319+138
001a12d PTS 24:55:01.111 8073100071
001a132 DTS 24:55:01.011 8073091062
001d841 PTS 24:55:00.748 8073067367
0022556 PCR 24:55:00.628 8073056524+157
00226d5 PTS 24:55:01.045 8073094065
0026a65 PTS 24:55:00.769 8073069287
0029dcd PTS 24:55:01.078 8073097068
00300f1 PTS 24:55:00.791 8073071207
0033225 PTS 24:55:01.212 8073109080
003322a DTS 24:55:01.111 8073100071
0038f69 PTS 24:55:00.812 8073073127
003bcea PCR 24:55:00.685 8073061729+175
...

「133000_GR23.ts」が問題の TS ファイル (23チャンネルなので TV東京 ^^;)。次の「0008c4a PCR 24:55:00.570 8073051319+138」という行は、ファイル先頭から 0008c4a バイト目に PCR があって、そのタイムスタンプが「24:55:00.570」であることを示す。

行末尾の「8073051319+138」は生の PCR の値。つまり、 PCR は 33bit の「PCR base」と 9bit の「PCR extension」から構成されるが、それぞれ 8073051319 と 138 であることを示す。 PCR base は 90kHz の解像度、 PCR extension は 27MHz の解像度。とりあえずここでは後者は無視して、前者 8073051319 を 90000 (= 90kHz) で割ると 89700.570 秒で、時分秒に直すと 24:55:00.570 になる。

PCR の他に、 PTS (Presentation Time Stamp) と DTS (Decode Time Stamp) というタイムスタンプも MPEG-2 TS には埋め込まれている。これらは PCR と違って 90kHz の解像度の 33bit のデータのみ。 MPEG-2 TS では、 PCR の時刻を基準にして、復号する時刻 (DTS) と再生する時刻 (PTS) を定めている (音声と映像の同期のためにも使われる)。前述したプログラムの出力において、 2カラム目に PTS, DTS と出力している行は、それぞれ PTS, DTS の値であることを示す。

で、 PCR の値を表示させてみていきなり気付いてしまったのだが、この問題の TS ファイルは PCR の値が 33bit の上限値ギリギリ。 33bit の上限は 0x1FFFFFFFF = 8589934591 だから、 PCR は 26:30:43.717 (26時間30分43秒余) までしかカウントできない。このファイルは冒頭のタイムスタンプが 24:55:00.570 だから、冒頭から 01:35:43.147 ほど経過したあたりで PCR の値が桁あふれ (オーバーフロー) を起こして 00:00:00.000 へ戻ってしまう (ラップアラウンド)。

これは冒頭から 1時間35分41秒ほど経過したあたりで ffmpeg が止まってしまう症状にピッタリ符合する (2秒ほど差があるのは MPEG-2 復号に要する時間?) ので、もう原因は PCR のラップアラウンド (PCR Wrap-around) で間違いないと推測。

「VLC で再生する分には問題がない」と書いたが、この問題の TS ファイルを VLC で再生して 1時間35分41秒あたり (VLC の場合 TS 再生時は時刻表示を行なわないのでシーンで探さざるを得ず大変) をよく見てみると、再生が一瞬 (1秒ほど?) 止まっていた。 26時間半に一度、必ず起こるラップアラウンドなのに、 VLC でも完全な対策は (まだ) 行なわれていないようだ。

原因調査の準備のために作ったスクリプトが、いきなり原因究明の役に立つとは (^^;) と思いつつ、 tsdump.pl にタイムスタンプの値を付け替える (すなわち 24:55:00.570 から始まるタイムスタンプを 00:00:00.000 始まりにリナンバーする) 処理を付け加えたスクリプト tsrenum.pl を書いてみた (後述する pcr_write, ts_write 関数を追加しただけ)。

% ./tsrenum.pl < 133000_GR23.ts > 133000_GR23_fixed.ts

tsrenum.pl を使ってタイムスタンプを付け替えた 133000_GR23_fixed.ts は、 ffmpeg を使って PS 変換ができるようになった。原因調査の準備のために作ったスクリプトが、ほとんどそのまま問題解決の役にも立ってしまった (^^;)^2。

tsrenum.pl は、標準入力から読み込んだ MPEG-2 TS において最初に現れた PCR/PTS/DTS タイムスタンプを基準 (下記スクリプト中の $pcrOrg) にして、タイムスタンプを付け替えて標準出力へ書き出す:

#!/usr/bin/perl
use strict;
use warnings;
use POSIX;
use Getopt::Std;
our ($opt_v);
getopts('v') || &help;
my $PacketSize = 188;
my $offset = 0;
my $pcrOrg;
for (;;) {
    my $buf;
    my $len = read(STDIN, $buf, $PacketSize);
    last unless $len > 0;
    my @buf = unpack("C*", $buf);
    die if $buf[0] != 0x47;        # sync byte
    my $ind = (($buf[1] & 0xE0) >> 5);
    my $adp = (($buf[3] & 0x30) >> 4);
    my $pos = 4;
    if ($adp & 0x2) {        # Adaptation field exist
        $pos++;
        my $af = $buf[$pos++];
        if ($af & 0x10) {
            my ($pcr33, $pcr9) = &pcr(\@buf, $pos);
            printf(STDERR "%07x PCR %s %d+%d\n",
                   $offset+$pos, &stime($pcr33), $pcr33, $pcr9) if $opt_v;
            &pcr_write(\@buf, $pos, $pcr33);
            $pos += 6;
        }
        if ($af & 0x08) {
            $pos += 6;
        }
        if ($af & 0x04) {
            $pos++;
        }
    }
    if ($ind & 0x02) {
        if ($buf[$pos] == 0x00 && $buf[$pos+1] == 0x00
            && $buf[$pos+2] == 0x01 && ($buf[$pos+6] & 0xC0) == 0x80) {
            my $flag = $buf[$pos+7];
            $pos += 9;
            if ($flag & 0x80) { # PTS
                my $ts = &ts(\@buf, $pos);
                printf(STDERR "%07x PTS %s %d\n",
                       $offset+$pos, &stime($ts), $ts) if $opt_v;
                &ts_write(\@buf, $pos, $ts);
                $pos += 5;
                if ($flag & 0x40) { # DTS
                    my $ts = &ts(\@buf, $pos);
                    printf(STDERR "%07x DTS %s %d\n",
                           $offset+$pos, &stime($ts), $ts) if $opt_v;
                    &ts_write(\@buf, $pos, $ts);
                    $pos += 5;
                }
            }
        }
    }
    syswrite(STDOUT, pack("C*", @buf), $len);
    $offset += $len;
}

sub stime {
    my ($ts) = @_;
    my $sec = floor($ts / 90000);        # 90kHz
    $ts -= $sec * 90000;
    my $min = floor($sec / 60);
    $sec -= $min * 60;
    my $hour = floor($min / 60);
    $min -= $hour * 60;
    return sprintf("%02d:%02d:%02d.%03d", $hour, $min, $sec, $ts/90);
}

sub help {
    print STDERR <
opt:   -v            ; verbose
EOF
    exit 1;
}

MPEG-2 TS を標準入力から 1パケットずつ @buf に読み込んで、 PCR を見つけたら
pcr(\@buf, $pos) 関数を呼び出して PCR base の値 $pcr33 を取得し、
pcr_write(\@buf, $pos, $pcr33) 関数で PCR base の値を変更して標準出力へ書き出す。 PTS, DTS についても同様に、 ts(\@buf, $pos) 関数を呼び出して値を取得し、 ts_write(\@buf, $pos, $ts) 関数で変更する。

ISO/IEC 13818-1 の 2.4.3.4節 Adaptation field (20ページ) の Table 2-6 - Transport Stream adaptation field を見ると、 adaptation field の 2バイト目から 33bit が PCR base の値、続いて 6bit の予約ビット、その次の 9bit が PCR extension の値であることが分かる。したがって pcr(\@buf, $pos) 関数は以下のように書ける:

sub pcr {
    my ($br, $pos) = @_;
    my $pcr33 = (($br->[$pos] << 25) | ($br->[$pos+1] << 17)
                 | ($br->[$pos+2] << 9) | ($br->[$pos+3] << 1)
                 | (($br->[$pos+4] & 0x80) != 0));
    my $pcr9 = ((($br->[$pos+4] & 0x01) << 8) | $br->[$pos+5]);
    return ($pcr33, $pcr9);
}

pcr_write(\@buf, $pos, $pcr33) 関数は PCR base の値 $pcr33 から $pcrOrg を減算してから pcr(\@buf, $pos) 関数の逆を行なうだけ:

sub pcr_write {
    my ($br, $pos, $pcr33) = @_;
    $pcrOrg = $pcr33 unless defined $pcrOrg;
    $pcr33 -= $pcrOrg;
    $br->[$pos] =   (($pcr33 >> 25) & 0xFF);
    $br->[$pos+1] = (($pcr33 >> 17) & 0xFF);
    $br->[$pos+2] = (($pcr33 >>  9) & 0xFF);
    $br->[$pos+3] = (($pcr33 >>  1) & 0xFF);
    if ($pcr33 & 1) {
        $br->[$pos+4] |= 0x80;
    } else {
        $br->[$pos+4] &= 0x7F;
    }
}

ISO/IEC 13818-1 の 2.4.3.7節 Semantic definition of fields in PES packet (31ページ) の Table 2-17 - PES packet を見ると、 PES (Packetized Elementary Stream) の 9バイト目から marker bit を挟みつつ 33bit の PTS と DTS が格納されていることが分かる。

したがって ts(\@buf, $pos) 関数と ts_write(\@buf, $pos, $ts) 関数は以下のように書ける:

sub ts {
    my ($br, $pos) = @_;
    return ((($br->[$pos] & 0x0E) << 29)
            | ($br->[$pos+1] << 22) | (($br->[$pos+2] & 0xFE) << 14)
            | ($br->[$pos+3] << 7)  | (($br->[$pos+4] & 0xFE) >> 1));
}

sub ts_write {
    my ($br, $pos, $ts) = @_;
    $pcrOrg = $ts unless defined $pcrOrg;
    $ts -= $pcrOrg;
    $br->[$pos] =   ((($ts >> 29) & 0x0E) | ($br->[$pos] & 0xF1));
    $br->[$pos+1] =  (($ts >> 22) & 0xFF);
    $br->[$pos+2] = ((($ts >> 14) & 0xFE) | ($br->[$pos+2] & 0x01));
    $br->[$pos+3] =  (($ts >>  7) & 0xFF);
    $br->[$pos+4] = ((($ts <<  1) & 0xFE) | ($br->[$pos+4] & 0x01));
}

すべて解決した後で気付いたのだが (^^;)、ラップアラウンドする TS ファイルを読み込んだときは ffmpeg が的確なエラーメッセージを出力していた:

...
frame= 1328 fps= 21 q=2.0 size=   31898kB time=44.00 bitrate=5938.8kbits/s dup=24 drop=0    
frame= 1341 fps= 21 q=2.0 size=   32002kB time=44.45 bitrate=5898.1kbits/s dup=24 drop=0    
[mpegts @ 0x6253c0]Invalid timestamps stream=0, pts=4078, dts=8589929661, size=53459
*** drop!
*** 1 dup!
*** drop!
*** drop!
*** drop!
*** drop!
*** drop!
adding -2147483648 audio samples of silence
adding -2147483648 audio samples of silence
*** drop!
...

「Invalid timestamps ... pts=4078, dts=8589929661」すなわち PTS が 00:00:00.045 なのに、 DTS が 26:30:43.663 なので無効なタイムスタンプである、というエラー出力。タイムスタンプがラップアラウンドしたときは、「Invalid timestamps」とは言えないと思うのだが...

念のため ffmpeg の最新版を「git clone git://git.ffmpeg.org/ffmpeg/」で取得してコンパイルしてみたのだが、「FFmpeg version git-735bbae」でも同様に「Invalid timestamps」エラーが出力された。

Nexus One で Android 2.2 froyo のマルチタッチを試してみる

hiroaki_sengoku — Sun, 25 Jul 2010 23:57:55 +0000

Android は 2.1-update1 以降でマルチタッチ (Multi-touch) をサポートしている。ところがマルチタッチといっても、ピンチイン/ピンチアウトなどのジェスチャをサポートしているだけのアプリが大半で、複数のタッチを独立に扱えるアプリはいまだほとんどなく、 iPhone と比べるとその差が際立っている。

どうして Android にはマルチタッチを活用したアプリケーションが無いのだろう？と思ったので、マルチタッチを試すテストアプリ MultiTouch.java (apk) を書いてみた:

タッチした位置にタッチの強さに応じた大きさの円を表示するだけの単純なアプリ。指を移動すれば円も追随する。 Android ではタッチID が順に割り振られるので、 ID が 0 のタッチを赤色の円で、 ID が 1 のタッチを緑色の円で描いている。

プログラム上は ID が 2 のタッチを青色の円で描くことになっているが、残念ながら現行の Android で同時に扱えるタッチは 2箇所のみ (追記: Samsung Galaxy S は 5箇所のマルチタッチが可能らしい) なので、 3箇所にタッチしても三つ目の円が描かれることはない。だから例えば iPhone のアプリにあるような鍵盤楽器アプリを作ろうと思っても、三つ以上の音を同時に鳴らすことはできない。

とはいえ、 2箇所のタッチを独立に扱えれば、いろいろ応用が効くだろうにと思いつつ、このテストアプリをいじっていると...

ありゃ?

上の写真の状態から、左指を上方へ、右指を下方へ動かしただけなのだが、両方の指の X 座標 (画面では上下方向) が交わった時点で両方の円の X 座標が入れ替わってしまって、緑円は右指の動きに合わせて下へ動き、赤円は左指の動きに合わせて上に動いた。その結果、指の位置と円の位置がずれてしまった:

つまり複数のタッチ (x_i, y_i), (x_j, y_j) を個別に扱えるのではなく、 X 座標の集合 {x_i, x_j} と Y 座標の集合 {y_i, y_j} として検知している模様。例えて言うならダイオード無しのスイッチ・マトリックスみたいな感じ。だから (x_i, y_i), (x_j, y_j) の 2点をタッチしているのか、 (x_i, y_j), (x_j, y_i) の 2点をタッチしているのか、の区別ができない。

Android のマルチタッチを扱うプログラムの書き方について解説している Web ページをほとんど見かけないので、 MultiTouch.java についても一応解説:

タッチイベントは、 MotionEvent インスタンスとして Android OS からアプリへ伝えられる。 MotionEvent#getAction() メソッドでイベント種別 (ACTION_DOWN ならタッチ開始、 ACTION_MOVE ならドラッグ、 ACTION_UP ならタッチ終了といった具合) が取得できる。

マルチタッチの場合、すなわちすでにタッチしている状況において追加で別の場所にタッチした場合、 ACTION_DOWN の代りに ACTION_POINTER_DOWN イベントが伝えられる。パネルから指が離れてタッチが終わる場合、まだ他の場所でタッチが継続しているのなら、 ACTION_UP の代りに ACTION_POINTER_UP イベントが伝えられる。

今回のテストプログラムの場合、タッチの座標が分かればよいので、 ACTION_DOWN, ACTION_POINTER_DOWN, ACTION_MOVE は区別せずに、 put_points メソッド (後述) でイベントの座標を記録している。

        public boolean onTouchEvent(MotionEvent ev) {
            int action = ev.getAction();
            switch (action & MotionEvent.ACTION_MASK) {
            case MotionEvent.ACTION_DOWN:
            case MotionEvent.ACTION_POINTER_DOWN:
            case MotionEvent.ACTION_MOVE:
                put_points(ev);
                break;
            case MotionEvent.ACTION_UP:
                points.remove(ev.getPointerId(0));
                break;
            case MotionEvent.ACTION_POINTER_UP:
                put_points(ev);
                int index = (action & MotionEvent.ACTION_POINTER_INDEX_MASK)
                    >> MotionEvent.ACTION_POINTER_INDEX_SHIFT;
                points.remove(ev.getPointerId(index));
                break;
            }
            Canvas canvas = getHolder().lockCanvas();
            if (canvas != null) {
                onDraw(canvas);
                getHolder().unlockCanvasAndPost(canvas);
            }
            return true;
        }

MotionEvent インスタンスには複数 (現状 2個までだが、 API 仕様的には 256個まで可能) のタッチの座標および強さ (pressure) が格納できて、 getX(i), getY(i), getPressure(i) の各メソッドを呼び出すことにより、 i番目 (i=0, 1,...) のタッチの X座標、Y座標、強さがそれぞれ取得できる。タッチの個数は getPointerCount() メソッドで取得できる。マルチタッチをサポートしない Android 2.0 eclair だと getPointerCount() は常に 1 を返す (ちなみに 1.5 cupcake や 1.6 donut だと getPointerCount() は存在しない)。

各タッチは、指がパネルに触れてから離れるまで固有の ID が OS によって割り振られるので、アプリは各タッチの動きをそれぞれ追うことができる。 getPointerId(i) メソッドを使えば i番目のタッチの ID が取得できる。

put_points(MotionEvent ev) メソッドでは、 id をキーとし、 TouchPoint (X座標、Y座標、強さの組) を値とするハッシュテーブル points に、各タッチの現在値を登録している:

    class TouchPoint {
        public float x;
        public float y;
        public float p;
    }
    Hashtable points;
        ...
        points = new Hashtable();
        ...

        void put_points(MotionEvent ev) {
            int count = ev.getPointerCount();
            for (int i=0; i < count; i++) {
                int id = ev.getPointerId(i);
                TouchPoint p = new TouchPoint();
                p.x = ev.getX(i);
                p.y = ev.getY(i);
                p.p = ev.getPressure(i);
                points.put(id, p);
            }
        }

現状 ID は 0 または 1 の値しかとらないようなので、ハッシュテーブル (java.util.Hashtable) は牛刀な感を否めないが、 API 仕様上 ID は int 型としか規定していない (つまり最大値が 1ではなく int 型の上限となる可能性がある ^^;) ので、配列ではなくハッシュテーブルを使った次第。

あとは SurfaceView#onDraw(Canvas canvas) にて、 points ハッシュテーブルに登録された座標、強さのデータ通りに円を描くだけ。

追記:
twitter で Galaxy S のマルチタッチはマトモと教えていただきました (_O_)
以下、頂いたツイートを (時間順に) 引用:

	gcd_org Androidのマルチタッチについて書いてるページが見当たらなかったのでブログを書いてみました https://www.gcd.org/blog/2010/07/613/ NexusOneだと座標を正しく取得できないケースがあるのですが他の機種だとどうですか？ #androidjp 2010年7月26日 10:41:34
	northeye @gcd_org Galaxy Sはわりとまとものようです http://www.youtube.com/watch?v=hVlsRCMltDg 2010年7月26日 10:45:20
	gcd_org @northeye すごい＞Galaxy Sのマルチタッチ。これで3点以上のマルチタッチがサポートされたら言うことなしですね。 RT Galaxy Sはわりとまとものようです http://www.youtube.com/watch?v=hVlsRCMltDg 2010年7月26日 10:54:20
	northeye @gcd_org 5点までいけるそうです http://www.youtube.com/watch?v=KRCDRXYJBCY 2010年7月26日 10:56:10
	nakamichito Galaxy Sではこんな感じです RT @gcd_org: Androidのマルチタッチについて書いてるページが見当たらなかったのでブログを書いてみました https://www.gcd.org/blog/2010/07/613/ #androidjp 2010年7月26日 11:13:40
	nakamichito URL忘れてた！ http://bit.ly/bFBicn RT @nakamichito: Galaxy Sではこんな感じです RT @gcd_org: Androidのマルチタッチについて書いてるページが見当たらなかったのでブログを書いてみました #androidjp 2010年7月26日 12:25:39

すでに同種のテストアプリが Android Market で公開されていたのですね。
車輪の再発明をしてしまった (後悔はしていない ;-)。

Nexus One の近接センサ/環境光センサは、どこにあるのか？調べてみた

hiroaki_sengoku — Fri, 16 Jul 2010 23:55:21 +0000

Nexus One など最近のスマートフォンには、加速度 (Accelerometer)、環境光 (照度, Ambient Light)、磁場 (磁界, Magnetic Field)、方位 (電子コンパス, Orientation)、近接 (Proximity) など、様々なセンサがついている。いろいろ応用できそうで夢がふくらむが、携帯電話本来の使い方 (つまり通話すること) において、使い勝手に直接影響する重要なセンサが近接センサ。

Nexus One や iPhone など全面タッチパネルの携帯電話だと、 (受話器として使うために) 耳に近づけたときタッチパネルが反応しては困る。そこで近接センサを使って顔が接近してくることを感知し、タッチパネルを無効にする (ついでにディスプレイをオフにして消費電力を抑える)。

私は Proximity なんて聞くと、 Proximity Warning System (接近警報システム) を思い浮かべてしまうくらいで、携帯電話用の近接センサがどういうしくみか全く知らなかった。今年1月の Nexus One の発表の時に近接センサのことを初めて知り、その時はタッチパネル全体への接近を感知する (静電容量の変化を検知して?) のかと想像したが、後述するように Nexus One の近接センサはタッチパネルの左上にしかなく、タッチパネルの下方への接近は感知できないことが分かった。

Nexus One のどこに近接センサが搭載されているか、センサの感応範囲がどれくらいなのか、私には見当もつかなかったし、 google で検索してもその手の情報は見つからなかったので、近接センサが感知した値を表示するだけの簡単なプログラムを書いてみた。

実は、私にとって初めての android アプリ (^^;)。しかも、ここ数年 Java から遠ざかっていたので、久々に書く Java プログラムだったりする。

お膳立ては Android SDK が全てやってくれるので、わずか 74行のプログラム。まず SensorManager#getSensorList メソッドで、 PROXIMITY タイプのセンサを取得し (sensor)、

        sensorManager = (SensorManager)getSystemService(SENSOR_SERVICE);
        List sensors
            = sensorManager.getSensorList(Sensor.TYPE_PROXIMITY);
        Sensor sensor = sensors.get(0);

この sensor の値が変化したときなどにセンサの値を受け取るリスナ (SensorEventListener) を、 SensorManager#registerListener メソッドで登録するだけ。

public class Proximity implements SensorEventListener {
        ...
        sensorManager.registerListener(this, sensor,
                                       SensorManager.SENSOR_DELAY_NORMAL);
        ...
    @Override
    public void onSensorChanged(SensorEvent event) {
        view.update(event.values);
    }

    @Override
    public void onAccuracyChanged(Sensor sensor, int accuracy) {
    }
}

近接センサの値が変化するとリスナの onSensorChanged メソッドが呼び出されるので、新しいセンサ値を描画する (view.update):

        void update(float[] values) {
            Canvas canvas = getHolder().lockCanvas();
            if (canvas == null) return;
            canvas.drawColor(Color.WHITE);
            Paint paint = new Paint();
            paint.setColor(Color.BLACK);
            paint.setTextSize(40);
            float height = paint.getTextSize();
            for (int i = 0; i < values.length; i++) {
                canvas.drawText(" "+values[i], 0, height * (i + 1), paint);
            }
            getHolder().unlockCanvasAndPost(canvas);
        }

Nexus One のタッチパネル左上隅近く (黒枠部分) にセンサがあるらしく、パネルまで 2cm ほどの距離に物体を近づけると反応する (センサの値が 9.0 から 0.0 へ変化する)。また、パネルと並行に物体を動かす場合、センサの真上から 1cm ほど外れると反応しなくなる。

　←　

鈴を近づけたことにより、
近接センサが反応して、
値が 0.0 になっている

赤外線型の近接センサ (赤外線を照射し、近接する物体からの反射光を測定するセンサ) なので、凸面の物体など赤外線があさっての方向へ反射してしまって受光素子に正しく届かない場合や、あるいは黒色の物体などあまり反射しない場合などでは、より近づけないと反応しない。

例えば、黒く細い丸棒などだと 1cm 以下に近づけないと反応しない。逆に白い紙 (凹面〜平面) など、効果的に赤外線を反射し、かつ受光素子に反射光が効率的に届くケースだと、 2cm より遠くても (8cm くらいでも) 反応する。

ちなみに、 Nexus One に搭載されている近接センサは、 Capella Microsystems の CM3602 という、環境光センサ付短距離近接センサ (Short Distance Proximity Sensor with Ambient Light Sensor) であるようだ。名前の通り環境光も測定できる。おそらく近接センサの受光素子をそのまま使って照度を測定しているのだろう。

前述したプログラムにおいて、「Sensor.TYPE_PROXIMITY」を「Sensor.TYPE_LIGHT」に置き換えれば、環境光センサの値を読み取ることができる。

Android SDK において、 Eclipse を使わずにアプリを開発する方法を説明しているページが少ないので、蛇足ながらビルド〜インストール方法を書いてみる。まず android コマンド (Android SDK の tools ディレクトリにある) を使って Project ディレクトリを作る:

T:\src\android>android create project --target 1 --path Proximity --activity Proximity --package org.gcd.test
Created project directory: T:\src\android\Proximity
Created directory T:\src\android\Proximity\src\org\gcd\test
Added file T:\src\android\Proximity\src\org\gcd\test\Proximity.java
Created directory T:\src\android\Proximity\res
Created directory T:\src\android\Proximity\bin
Created directory T:\src\android\Proximity\libs
Created directory T:\src\android\Proximity\res\values
Added file T:\src\android\Proximity\res\values\strings.xml
Created directory T:\src\android\Proximity\res\layout
Added file T:\src\android\Proximity\res\layout\main.xml
Created directory T:\src\android\Proximity\res\drawable-hdpi
Created directory T:\src\android\Proximity\res\drawable-mdpi
Created directory T:\src\android\Proximity\res\drawable-ldpi
Added file T:\src\android\Proximity\AndroidManifest.xml
Added file T:\src\android\Proximity\build.xml

T:\src\android>

「--target 」オプションは、利用する Android platform library を指定する。の一覧は、「android list targets」を実行することで得られる。

「--activity 」オプションは、アプリを起動したとき最初に表示される画面のクラス名を指定する。

作った Project ディレクトリ T:\src\android\Proximity の中に、 T:\src\android\Proximity\src\org\gcd\test\Proximity.java があるので、これを書き換える。私の場合、 T: ドライブは Linux マシン (正確に言えば coLinux) のファイルシステムなので、 Linux 上の emacs を使って書き換えている。

あとは ant コマンドを使ってビルドするだけ。 Eclipse などの IDE (統合開発環境) を使う必要性を全く感じないのだが...

T:\src\android>cd Proximity

T:\src\android\Proximity>ant debug
Buildfile: T:\src\android\Proximity\build.xml
    [setup] Android SDK Tools Revision 6
    [setup] Project Target: Google APIs
    [setup] Vendor: Google Inc.
    [setup] Platform Version: 2.1-update1
    [setup] API level: 7
    [setup] WARNING: No minSdkVersion value set. Application will install on all Android versions.
    [setup] Importing rules file: platforms\android-7\ant\ant_rules_r2.xml

-compile-tested-if-test:

-dirs:
     [echo] Creating output directories if needed...
    [mkdir] Created dir: T:\src\android\Proximity\gen
    [mkdir] Created dir: T:\src\android\Proximity\bin\classes

-resource-src:
     [echo] Generating R.java / Manifest.java from the resources...

-aidl:
     [echo] Compiling aidl files into Java classes...

compile:
    [javac] C:\android-sdk-windows\platforms\android-7\ant\ant_rules_r2.xml:255: warning: 'includeantruntime' was not set, defaulting to build.sysclasspath=last; set to false for repeatable builds
    [javac] Warning: org\gcd\test\R.java modified in the future.
    [javac] Compiling 2 source files to T:\src\android\Proximity\bin\classes

-dex:
     [echo] Converting compiled files and external libraries into T:\src\android\Proximity\bin\classes.dex...

-package-resources:
     [echo] Packaging resources
 [aaptexec] Creating full resource package...

-package-debug-sign:
[apkbuilder] Creating Proximity-debug-unaligned.apk and signing it with a debug key...
[apkbuilder] Using keystore: C:\Documents and Settings\sengoku\.android\debug.keystore

debug:
     [echo] Running zip align on final apk...
     [echo] Debug Package: T:\src\android\Proximity\bin\Proximity-debug.apk

BUILD SUCCESSFUL
Total time: 6 seconds
T:\src\android\Proximity>

T:\src\android\Proximity\bin\Proximity-debug.apk に apk ファイル (Android Package) ができるので、 adb コマンド (これも Android SDK の tools ディレクトリにある) を使って Nexus One へインストールする。

T:\src\android\Proximity>adb install bin\Proximity-debug.apk
296 KB/s (14596 bytes in 0.048s)
        pkg: /data/local/tmp/Proximity-debug.apk
Success

T:\src\android\Proximity>

あるいは、 T:\src\android\Proximity\bin\Proximity-debug.apk を Web サーバ上に置いて、 Internet 経由でダウンロード & インストールしてもよい (アプリケーションの設定にて、「提供元不明のアプリ」のインストールの許可が必要)。

以上、 Windows のコマンドプロンプトでの実行例を示したが、もちろん Linux 上でも全く同様にビルド〜インストールが可能。

Google カレンダーの過去の予定を自動的に削除する方法

hiroaki_sengoku — Thu, 08 Jul 2010 00:44:19 +0000

ここ 2ヶ月ほど、 Willcom の HYBRID W-ZERO3 から Nexus One への移行を徐々に進めてきた。 Windows Mobile (HYBRID W-ZERO3) は PC とのデータ同期が基本なので、 PC にスケジュールや電話帳など丸ごと入れておけば済むが、 Android (Nexus One) の場合は「クラウド」との同期が基本なので一筋縄にはいかない。つまり「クラウド」に全てのスケジュールを置いていいのか？という問題。私の場合、「スケジュール」といいつつ会議の議事メモから個人的な日記まで、プライベートな情報を全て集積しているので問題がより深刻になる。

ちなみに私は、 1999年に WorkPad 30J を使い始めて以来、プライベートなデータを PDA / スマートフォンに集積してきた。今まで使ってきた PDA / スマートフォンをまとめてみる:

購入月	機種	OS
1999-04	WorkPad 30J	PalmOS 3.1J
2000-03	TRGpro	PalmOS 3.5
2000-08	Palm m100	PalmOS 3.5.1
2002-09	Zaurus MI-E1	ZaurusOS
2002-12	Linux Zaurus SL-C700	Linux 2.4 Embedix
2003-06	Linux Zaurus SL-C750	Linux 2.4 Embedix
2006-07	W-ZERO3[es]	Windows Mobile 5.0
2007-07	Advanced W-ZERO3[es]	Windows Mobile 6 Classic
2008-12	HTC P3600	Windows Mobile 5.0
2010-01	HYBRID W-ZERO3	Windows Mobile 6.5 Professional
2010-04	Nexus One	Android 2.2 froyo
2010-06	iPhone 4	iOS 4
2010-11	IS01	Android 1.6 donut
2010-12	Galaxy S	Android 2.2 froyo
2010-12	IDEOS U8150-B	Android 2.2 froyo
2011-03	Nexus S	Android 2.3 gingerbread
2011-05	nook color	Android 3.0 honeycomb
2011-12	Galaxy Nexus	Android 4.0 ice cream sandwich
2012-12	Galaxy S3	Android 4.0 ice cream sandwich
2013-07	Galaxy Mega 5.8	Android 4.2 jelly bean
2013-11	Nexus 5	Android 4.4 kitkat
2014-03	iPhone 5s	iOS 7.0
2016-01	Nexus 5X	Android 6.0 marshmallow
2016-12	ZenFone 3 ZS570KL	Android 6.0.1 marshmallow

WorkPad 30J から HYBRID W-ZERO3 に至るまで、全て PC とのデータ同期が基本だったし、それぞれデータ移行ツールが用意されていたので移行は容易だった。ところが Nexus One で同じような同期を行なうには、データを PC ではなく Google Calendar へ置かなければならない。

もちろん、 Google Calendar は共有設定さえ行なわなければ他人に読まれることはないだろうし、「don't be evil」と言ってるくらいだから、 Google が勝手にユーザのデータを活用する可能性も無い (と信じたい)。

だからといって、個人的なデータや会社の超機密事項 (議事メモにはそういった情報も含まれる) も洗いざらい Google に預けてしまう、なんてことは小心な私にはとてもできない。よく知られているように Google Calendar は「限定公開 URL」が漏れるだけで一巻の終わりであるわけで、漏れることを前提でリスク評価すべき。

というわけで、議事メモや日記を Google Calendar に置くことはハナからあきらめて、 Google Calendar には直近の予定だけを置くことにした。万一漏れても、向こう一週間くらいの予定だけであれば、致命的というほどでもない。

ところが驚いたことに Google Calendar には過去の予定を一括削除する機能がない。手作業でいちいち消していかない限り、データは残り続けるようだ。当たり障りのない「予定」でも積み重なればいろいろ見えてくることがあるわけで、長年にわたって溜った予定データは脅威となりうる。

どうしてこんな超基本機能が無いのだろうと思いつつ google で検索してみると、見つかるのは「どうやったら過去のデータを (一括) 消去できるのか？」という質問のページばかり。過去データを削除したい、というニーズは確実にありそうなのに、なぜ Google は実装しようとしないのか？そういえば gmail も過去のメールを溜め続けるのが基本だし、 Google Calendar に自動的に削除する機能がないのは意図的なのかもしれない。

無い機能は作ってしまえと、 Google Calendar API のドキュメントを眺めてみる。 API を叩くためのクライアントライブラリが用意されているようだ。が、.NET とか Java とか Python とか PHP とか、あまり気の進まない (^^;) 言語ばかりが並んでいる。 Perl は無いのかっと思って CPAN を検索したら、 Net::Google::Calendar があっさり見つかった。

マニュアル片手にテストプログラムを書いてみる:

use Net::Google::Calendar;
use DateTime;
my $cal = Net::Google::Calendar->new;
$cal->login('sengoku@gmail.com', 'xxxxxxxx');
for my $event ($cal->get_events('start-max' => DateTime->now
                                - DateTime::Duration->new(days => 7))) {
    $cal->delete_entry($event);
}

たったこれだけ。最初に login($user, $pass) して、 get_events(%opts) で「予定」データを取り出して、 delete_entry($event) で削除。 get_events の引数で、開始時刻が一週間以上過去の予定のみ取り出すよう指定している。

ちょっと書き足して、ユーザID やパスワードを設定ファイルで設定できるようにしたスクリプト gcal_remove を作ってみた。

% gcal_remove -c /path/to/config.yaml -d 7

などと実行すると、 7日間以上前の予定を削除する。

設定ファイル config.yaml は以下のような感じ:

google_user: sengoku@gmail.com
google_passwd: xxxxxxxx

サイボウズオフィス8 のカレンダーを iCalendar 形式に変換するスクリプトを書いてみた

hiroaki_sengoku — Wed, 26 May 2010 07:01:33 +0000

私の職場ではグループウェアとしてサイボウズを利用している。自分のスケジュールを iCalendar 形式で取得してみたくなった (Nexus One を買うとそういう気分になる ^^;) ので、 google で検索してみたところ次の二つのスクリプトが見つかった:

あいにく職場のサイボウズはオフィス8 なので、オフィス8 に未対応の前者は使えない。後者はオフィス8 用だが、「暫定版」と書いてある通りいろいろバグがある。さくっと修正してみて一応それっぽく動かすことはできたのだが、使い続けていくとなると一から書き直したほうがいいような気がしてきた (わたし的にはこの手のものを PHP スクリプトでは書きたくない) ので、 perl で書き直してみた。

この perl スクリプト cybozu8_ical を、

% cybozu8_ical --conf /path/to/config.yaml

などと実行すると、オフィス8 の「月予定」 (月間スケジュール) ページをアクセスして、 iCalendar 形式に変換する。向こう一週間以内の予定については「予定の詳細」ページもアクセスして、「メモ」および「設備」も取得する。「月予定」の全ての予定について「予定の詳細」をアクセスすると、オフィス8 サーバに負荷をかけすぎる懸念があったので、このような仕様にしてみた。

設定ファイル config.yaml は以下のような感じ:

cybozu_url: http://intra.klab.org/cgi-bin/klcb/ag.cgi
calname: cybozu
userid: 73
password: xxxxxxxx
time_zone: Asia/Tokyo
input_encoding: shiftjis
output_file: /home/sengoku/tmp/cybozu.ics

「cybozu_url」はオフィス8 の URL を指定する (もちろん intra.klab.org は KLab 社内LAN からしかアクセスできない)。「userid」と「password」はスケジュールを取得したいユーザの ID とパスワード。「output_file」に指定したファイルへ iCalendar 形式のスケジュールを出力する。「output_file」を省略すると標準出力へ書き出す。

なお「--conf /path/to/config.yaml」オプションを省略すると、 cybozu8_ical と同じディレクトリにある config.yaml が読み込まれる。

cybozu8_ical で生成した iCalendar 形式のファイルは、とりあえず Google カレンダーおよび Thunderbird + Lightning で読み込めることは確認したが、なにぶんまだ RFC 2445 を真面目に読んでいないので、不具合などあったらご指摘頂けると有難い。

私はオフィス8 の API を知らないので、「月予定」「予定の詳細」のページを取得してきて scrape しているだけ。「繰り返し予定」は個々の予定として扱っている。 iCalendar の UID (各予定固有のID) が同じままだと 2個目以降の予定が無視されてしまうので、 UID の末尾に通し番号をつけて互いに区別できるようにしている。

サイボウズのスケジュールは「場所」を登録できない。その代わり「施設」として会議室を登録する。ところが私の職場の場合「施設」には会議室だけでなく「ビデオ会議システム」などもあったりするので、「施設」に登録されているデータをそのまま iCalendar の LOCATION として使うわけにもいかない。そこで「施設」に会議室の名称が登録されている場合のみ、その会議室名を LOCATION として出力するようにしている。

iCalendar の LOCATION として出力すべき会議室名の一覧を、 cybozu8_ical スクリプトの始めの方で、

my @facility = (
        '20F 大会議室1', '20F 大会議室2', '20F 大会議室3',
        '20F 中会議室1', '20F 中会議室2',
        '20F 小会議室1', '20F 小会議室2',
        '20F 和室', '22F 社長室前MTGｽﾍﾟ-ｽ'
);

などと定義している。ここに列挙されていない会議室等は「施設」に登録されていても単に無視される。

tinydns のゾーンを MyDNS へ反映させるスクリプトを書いてみた

hiroaki_sengoku — Mon, 08 Mar 2010 00:25:06 +0000

MyDNS というのは MySQL (あるいは PostgreSQL) のレコードを、そのままゾーンレコードとして扱えるネームサーバ。私は MyDNS を使って実験的にダイナミックDNSサービスを (もちろん無償で) 提供している。実験と言いつつ、サービス開始以来 2年以上安定的に継続できているし、先月から海外レンタルサーバを使って地域分散したので、仮に私の自宅の回線が切れてもネームサーバが見えなくなることはない。

gcd.jp のマスタネームサーバである ns.gcd.jp と、スレーヴネームサーバである ns2.gcd.jp (海外サーバ fremont.gcd.org の別名。名前の通りカルフォルニア州フリーモントにある) とは、 MySQL のレプリケーションによってゾーンデータを同期させている。したがってマスタ側での変更が即座にスレーヴ側に伝わる。

ちなみに、ネームサーバ間の同期でよく利用されるゾーン転送 (AXFR) は、ゾーンデータを丸ごと転送するので (ゾーンが大きくなってくると) 同期頻度を高くすることが難しく、ダイナミックDNSサービスにはあまり向いていない。 MySQL のレプリケーションでネームサーバ間の同期が行なえてしまう MyDNS は、ダイナミックDNSサービス向きと言える。

ところが gcd.org では (ダイナミックではない) 普通のネームサーバ ns1.gcd.org も運用していて、これは tinydns を利用している。せっかく海外にサーバ fremont.gcd.org を借りたのだから、 tinydns で管理しているゾーンも fremont.gcd.org で引けるようにしたいが、 fremont に複数 IP アドレスを付与するのはお金がかかる (月額 $1 追加) ので、 fremont で MyDNS と tinydns の両方を走らせるわけにもいかない。

私が借りてるレンタルサーバ (正確に言うと VPS) Linode は、もともと DNS サービス (マスタ/スレーヴどちらでも、ドメインいくつでも) を無料で利用できるので、 DNS のためだけに 1IP 追加する気にはちょっとなれない。

もちろん、 tinydns を止めてしまって全てのゾーンを MyDNS へ移行してしまうという解決策も無くはないのだが、 MyDNS に全面的に依存してしまうのは恐い気もする。できれば tinydns 側はいじらずに、 tinydns のゾーンデータを MyDNS 側へ反映させる仕掛けを作りたい。

というわけで、 tinydns のゾーンデータを読み込み、 MyDNS のゾーンデータの形式で MySQL へレコードを書込む perl スクリプト tinydns2mydns を書いてみた (CVSリポジトリ)。

なお MyDNS には、 mydnsimport という外部からゾーンデータを取り込むツールが付属していて、 tinydns のゾーンデータもインポートできるのだが、以下の欠陥があってゾーン転送目的には使えない:

ゾーンの全レコードをいったん削除した上でインポートを行なう実装になっている。
SRV レコードをインポートできない。

1. tinydns 側で新しいレコードを追加したとき、対応するレコードのみを DB に INSERT できる実装になっているかと思いきや、ソースを確認してみると、いったん全部 DELETE した後 tinydns のゾーンデータを 1レコードずつ INSERT する実装になっていた。

つまり、短い時間とはいえ、ゾーンにレコードが存在しないタイミングが存在する。したがって、その瞬間に届いたクエリに対して非存在 (NXDOMAIN) を回答してしまう。 mydnsimport のソースをいじって、 DELETE してから INSERT 完了まで読み込みをロックするようにすれば、 NXDOMAIN を返すこと自体は回避可能だが、ネームサーバとしての性能を大いに損ねてしまう。

2. tinydns には A, AAAA, NS, CNAME, PTR, MX, TXT 以外の任意のタイプのレコードを定義する方法として、タイプを数値で指定する汎用記法がある:

:fqdn:n:rdata:ttl:timestamp:lo

Generic record for fqdn. tinydns-data creates a record of type n for fqdn showing rdata. n must be an integer between 1 and 65535; it must not be 2 (NS), 5 (CNAME), 6 (SOA), 12 (PTR), 15 (MX), or 252 (AXFR). The proper format of rdata depends on n. You may use octal \nnn codes to include arbitrary bytes inside rdata.
The tinydns-data program から引用

この記法を利用して、例えば以下のように SRV レコードを定義できる。

:_jabber._tcp.jabber.jp:33:\000\012\000d\024\225\006jabber\002jp\000:300

つまり fqdn が「_jabber._tcp.jabber.jp」、 n が「33」で SRV の意味。 rdata はタイプによってデータの意味が変わってくるが、 SRV の場合は次のような構造になる:

┌─┬─┬─┬─┬─┬─┬─┬─≫┬─┬─┬─┬─≫─┬─┬─┐
│優先度│ 重み │ポート│長│ホスト名│長│ドメイン名……│０│
└─┴─┴─┴─┴─┴─┴─┴─≪┴─┴─┴─┴─≪─┴─┴─┘

つまり先頭から 2バイトずつ 3つの数値 (ネットワークバイトオーダ) を表わし、複数個の文字列 (先頭に 1バイトの文字列長) が続いて最後に 0。前述の SRV レコードの場合であれば、優先度は「\000\012」つまり 8進数で 000 012 だから 10進数だと 10 になる。以下同様に重みが 100 で、ポート番号が 5269 で、続く文字列が「jabber」と「jp」でホスト名 jabber.jp を意味する。

　優先度　 重み 　ポート　ホスト名
┌─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┬─┐
│00　0A│00　64│14　95│06│ｊ│ａ│ｂ│ｂ│ｅ│ｒ│02│ｊ│ｐ│00│
└─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘
　　10　　 100　　 5269 　　　　　6 文字　　　　　　　　　2 文字

ゾーンファイルの書式で書けば次のようなレコードになる:

_jabber._tcp.jabber.jp.        300        IN        SRV        10 100 5269 jabber.jp.

つまり、ドメイン jabber.jp における TCP/IP の jabber サービスは、ホスト jabber.jp の 5269 番ポートにアクセスすればよい、ということを表わす。同じサービスを提供するホスト・ポートが複数ある場合、優先度の数値が (アクセス可能なものの中で) 最小のものに接続することが求められる (MUST)。同じ優先度のホスト・ポートが複数ある場合は、重みの比率に応じてアクセスを振り分けるべき (SHOULD)。

tinydns2mydns スクリプトにおいて SRV レコードを変換する部分は次のようになっている:

    # :fqdn:n:rdata:ttl:timestamp:lo
    elsif ($top eq ':') {
        my ($fqdn, $n, $rdata, $ttl, $timestamp, $lo) = @_;
        my $domain = &get_domain($fqdn);
        next unless defined $domain;
        my $name = &get_host($fqdn, $domain);
        if ($n == 33) {
            $rdata =~ s/\\(\d\d\d)/sprintf("%c", oct($1))/ge;
            my ($priority, $weight, $port, @target)
                = unpack("nnn(C/a)*", $rdata);
            &record($sth_insert, $sth_update,
                    $Zones{$domain}, $name,
                    'SRV', "$weight $port " . join(".", @target),
                    $priority, $ttl, $lo);
        }
    }

眺めるだけで処理が見えてくる見通しのよいスクリプトだと思う (自画自賛 ;)。 $n が 33 のとき SRV レコードだから続く $rdata を読み込んで、 8進数表記 \nnn をバイトデータへ変換し、「優先度」「重み」「ポート」および複数個の文字列に分解する:

$rdata =~ s/\\(\d\d\d)/sprintf("%c", oct($1))/ge;
my ($priority, $weight, $port, @target) = unpack("nnn(C/a)*", $rdata);

C で書けば何十行にもおよぶであろうこの処理をわずか 2行で書けてしまう perl はスゴイと改めて思う。あとは分解したデータを MyDNS のレコードの形式に組み立てるだけ:

$Zones{$domain}, $name, "$weight $port " . join(".", @target), $priority, $ttl

mydnsimport のソースが C で 2000行近くもある (MyDNS ライブラリ群のソースを除く) のに対し、 tinydns2mydns はわずか 353行で書けてしまい、しかも上記 mydnsimport にある欠陥を解決できている。現状では tinydns の汎用記法のうち SRV しか対応していないが、スクリプトの見通しがよいため他タイプに対応させるのも容易だろう。

tinydns2mydns スクリプトが DB に書込んだレコードは以下のようになる:

mysql> select * from rr where name='_jabber._tcp';
+-----+------+--------------+------+---------------------+-----+-----+
| id  | zone | name         | type | data                | aux | ttl |
+-----+------+--------------+------+---------------------+-----+-----+
| 817 |   13 | _jabber._tcp | SRV  | 100 5269 jabber.jp. |  10 | 300 |
+-----+------+--------------+------+---------------------+-----+-----+
1 row in set (0.00 sec)

外部のサイトから jabber.jp の SRV レコードを問合わせてみると、 fremont も正しいレコードを返すことが確認できる:

% host -t srv _jabber._tcp.jabber.jp fremont.gcd.org
Using domain server:
Name: fremont.gcd.org
Address: 74.207.241.21#53
Aliases: 

_jabber._tcp.jabber.jp has SRV record 10 100 5269 jabber.jp.

% host -t srv _jabber._tcp.jabber.jp
_jabber._tcp.jabber.jp has SRV record 10 100 5269 jabber.jp.