

エルブラン・セマンティクス(Herbrand Semantics)理解メモ


データベースのトランザクション(特にスケジュール)の理論を勉強しようとすると、エルブラン・セマンティクス(Herbrand Semantics)の理解が必要となります。

Herbrand Semantics の解説は以下の本・章にあります。

Transactional Information Systems: Theory, Algorithms, and the Practice of Concurrency Control and Recovery (The Morgan Kaufmann Series in Data Management Systems)

該当章:3.5 Herbrand Semantics of Schedules





  1. a step ri(x) ∈ s of a transaction ti ∈ trans(s) reads the value written by the last wj(x) ∈ s, j ≠ i, that occurs before ri(x);
  2. a step wi(x) ∈ s writes a new value that potentially depends on the values of all data items that ti has read from the database or from other transactions in active(s) ∪ commits(s) prior to wi(x).


  1. ri(x)は最後にwriteされた値xをreadする。
  2. wi(x)はそのトランザクションtiがwi(x)の前にreadした全ての値に依存している。

DEFINITION 3.3 Herbrand Semantics of Steps

Let s be a schedule. The Herbrand semantics Hs of steps ri(x), wi(x) ∈ op(s) is recursively defined as follows:

  1. Hs(ri(x)) := Hs(wj(x)), where wj(x), j ≠ i, is the last write operation on x in s before ri(x).
  2. Hs(wi(x)) := fix(Hs(ri(y1)),...,Hs(ri(ym))), where the ri(yj), 1 ≤ j ≤ m, represent all read operations of ti that occur in s before wi(x), and where fix is an uninterpreted m-ary function symbol.

Hs は Herbrand semantics のことです。

1. Hs(ri(x)) := Hs(wj(x))

Hs(ri(x)) を Hs(wj(x))と定義するということです。
ri(x) は wj(x) に等しい、つまり最後にwriteした値をreadする、ということです。

2. Hs(wi(x)) := fix(Hs(ri(y1)),...,Hs(ri(ym)))

"m-ary function"とは「m項関数」と呼ばれ、m個の引数をもつ関数のことです。


ここでのポイントは read/write が m-ary function に変換可能ということにあります。

s = r1(x)r2(y)w2(x)w1(y)c2c1

値x, yには初期値があるはずです。これをトランザクションt0が書き込んだものと仮定すれば、次のスケジュールになります。
s = w0(x)w0(y)c0r1(x)r2(y)w2(x)w1(y)c2c1


is as follows, where f0x() and f0y() are 0-ary functions (constants):

Hs(w0(x)) = f0x()
Hs(w0(y)) = f0y()
Hs(r1(x)) = Hs(w0(x)) = f0x()
Hs(r2(y)) = Hs(w0(y)) = f0y()
Hs(w2(x)) = f2x(Hs(r2(y)) = f2x(f0y())
Hs(w1(y)) = f1y(Hs(r1(x)) = f1y(f0x())

Herbrand semantics Hs を展開していくと、どのread/writeもf0x()/f0y()を含む関数の式に変換されます。つまり、read/writeを初期状態と関数の式で表現できたということであり、異なるスケジュールのトランザクションの各ステップ(read/write)が同じ結果となるかを数式で比較可能となります。Herbrand semantics で表現することの価値はここにあります。

Herbrand Semantics の式の表現は異なりますが、実現していることは同じです。

DEFINITION 3.4 Herbrand Universe

Let D = {x, y, z,...} be a (finite) set of data items (representing the data of the underlying data server(s)). For a transaction t, let op(t) denote the set of all steps of t. The Herbrand universe HU for transactions ti, i > 0, is the smallest set of symbols satisfying the following conditions:

  1. f0x() ∈ HU for each x ∈ D, where f0x is a 0-ary function symbol (i.e., a constant);
  2. if wi(x) ∈ op(ti), |{ri(y) | (∃y ∈ D) ri(y) <ti wi(x)}| = m, and if v1,..., vm ∈ HU, then fix(v1,...,vm) ∈ HU, where fix is an m-ary function symbol.

"{ri(y) | (∃y ∈ D) ri(y) <ti wi(x)}"は集合の内包的記法です。
{ (代表元) | (代表元の満たすべき条件)} です。例えば {x | x ∈ S, P(x)} は S の元のうち、命題 P(x) が真であるものすべてを集めた集合を意味しています。
また、集合Aの要素数は|A|で表現されます。例えば、A={1,2,3,4}, |A|=4です。

つまり、"|{ri(y) | (∃y ∈ D) ri(y) <ti wi(x)}| = m"とはTiがwi(x)の前にreadした回数をmとする、ということです。

これを踏まえて DEFINITION 3.4 をまとめると、

  1. f0xは0項関数で定数だ。
  2. fixはm項関数(m個の引数を持つ)で、mはTiがwi(x)の前にreadした回数に等しい。


2.でfixとwi(x)の関係がピンとこない場合は DEFINITION 3.3を再確認してください。下記の式で wi(x)の Herbrand Semantics は fixの関数で表現されることが示されています。
Hs(wi(x)) := fix(Hs(ri(y1)),...,Hs(ri(ym)))

DEFINITION 3.5 Schedule Semantics

The semantics of a schedule s is the mapping

H[s] : D → HU

defined by

H[s](x) := Hs(wi(x))

where wi(x) is the last operation from s writing x, for each x ∈ D.

"H[s] : D → HU"とは写像の表記です。

写像とは"f : A → B"の形で表現され、Aの要素が決まるとBの要素が決まる対応関係です。
"f(A) = B"のように、fはAを引数にとってBとなる、と考えるとわかりやすいかもしれません。

つまり、"H[s](x) := Hs(wi(x))"は "H[s](x)" がスケジュールsの値xの最終的な状態(最後のwrite操作)を Herbrand Semantics で表現する、ということを表しています。

s = w0(x)w0(y)c0r1(x)r2(y)w2(x)w1(y)c2c1

H[s](x) = Hs(w2(x)) = f2x(f0y())
H[s](y) = Hs(w1(y)) = f1y(f0x())

この例でスケジュールsの値xに対する最後のwrite操作はw2(x)、値yに対する最後のwrite操作はw1(y)であり、H[s](x), H[s](y) は これらのwrite操作を Herbrand Semantics で表現するということです。