七度

挽救一些大脑想要驱逐的东西——一些黑泥,一些杂感,一些工作

0%

摸了好久。

说实话今天倒了一堆黑泥之后才发现可能学习才是最让人有愉悦感的事情之一,但是我却一直在逃避……也不知道怎么样才能从这样的空虚感里解脱出来。

总之做一下翻译的第一部分。

翻译

Otium est bonum, sed otium multorum est parvum.

Leisure is good, but the leisure of many is small.

这里的出现的形容词和名词都对应的是中性,而注意到multorum是属格而非主格,因此不是much leisure而是leisure of many,这里应该也有形容词multum当作名词的语法现象。Otium有peace和leisure两个意象,一开始想用peace,不过仔细读之后感觉还是leisure更通顺一点。

Bella sunt mala et multa pericula habent.

Wars are bad and have much danger.

注意第一二变格法的中性复数主格和阴性单数主格形式相同,这个句子里书上标出了bella是bellum的派生,而我们观察sum的变形也可以注意到这一点。

Officium nautam de otio hodie vocat.

The duty summons the sailor from leisure today.

首先理清主语谓语和宾语分别是主格的officium, 第三人称单数动词vocat和单数宾格的nautam, 然后补上介夺结构和副词。

Pauci viri multas formas periculi in pecunia vident-non debemus esse avari!.

Few men see the many forms of danger in money - we ought not to be greedy!

注意到前后动词位的变化——破折号之前的vident是第三人称复数,而破折号之后的debemus是第一人称复数,因此需要为后面的句子补上主语we.

Si multam pecuniam habetis, saepe non estis sine curis.

If you have much money, you are not often without worries.

前后的整体基调都是第二人称复数,注意到这里表示大小和多少的形容词multam放在了被修饰的pecuniam前面,而两者都是阴性宾格,因此需要为两个句子都补上主语you.

Puellae magistram de consilio malo sine mora monent.

The girls advise the schoolmistress about the bad plan without delay.

其实本来想用warn的,不过还是advise看起来更符合这样的辈分关系。这个句子和第三句一样,先出现了主语和宾语,然后是很长的介夺结构和副词结构,最后才出现了动词,很容易被绕进去(指我自己)。

O magne poeta, sumus veri amici; me iuva, amabo te!

O great poet, we are true friends; help me, please!.

这里出现了呼格和命令式,语气很强烈。

Femina et agros et portam agricolae videt.

The women sees the farmer’s farm and gate.

句子本身的含义感觉相当意义不明……结构上的重点是之前出现过的et…et…结构,由于videt是第三人称单数,而只有femina是主格,因此这里femina必然不与后面的agros和portam并列,只有这两个都是宾格的词并列。

You are in great danger.

In magnum periculum es.

书上标出you是单数,因此用es.

My son’s opinions are often foolish.

Sententiae fīliī meus saepe stulta sunt.

看到也有用fīliī mei的,不过感觉还是meus好一点?其实还是有点分不清,如果有懂的朋友看到希望能指教。

The daughters and sons of great men and women are not always great.

Filiae et fili magnorum virorum et feminarum non semper magni sunt.

很残酷的事实。

Without wisdom the sailors’ good fortune is nothing and they are paying the penalty.

Sine sapientia, fortuna bona nautarum nihil est, et poenas dant.

在英译拉的时候也需要注意到位的变换,前面是运气做主语的第三人称单数,而后面是水手做主语的第三人称复数,因此分别是est和dant.

周末就要东大面试的笔试+面试了……紧张。相比于其他摸鱼方式感觉写这个会稍微没有负罪感一些。

第四课主要关注第二变格法中中性词的部分、形容词的变格、sum的现在时及其相关语法,以及一些杂项。

第二变格法(中性部分)

除了阳性名词以外,第二变格法中也包括了不少的中性词。

中性词仅有主格、宾格与呼格的形式与响应变格法的其他性词不同:单数以-um结尾而复数以-a结尾,自然,正因为有这样的共同点我们才能称其为第二变格法。Wheelock’s提到所有变格法的中性词都有此特点,这也意味着可能不太好通过词尾变化来判断一个中性词是做主语成分还是作宾语成分,而需要额外的通过语境和语义进行判别的成本。如果会碰到什么麻烦相信在翻译的部分会有更深的理解。

尽管如此,为了方便查找和记忆还是将所有变化列出如下表。

单数 复数
主格 -um -a
属格 -i -orum
与格 -o -is
宾格 -um -a
夺格 -o -is
呼格 -um -a

除了主格与属格可能会混淆以外,第二变格法中性词的复数主格也容易与第一变格法的单数主格相同,因此记忆时性也是必须的一部分———好在我们有Wiktionary.

形容词的变格和一致

正如之前在3-1节已经提到过的一样,对于不同的性的名词,具有三个性的形容词需要选择对应的词尾,对于第一、二变格法形容词来说即为

阳性 阴性 中性
单数
主格 -us -a -um
属格 -i -ae -i
与格 -o -ae -o
宾格 -um -am -um
夺格 -o -a -o
呼格 -e -a -um
复数
主格 -i -ae -a
属格 -orum -arum -orum
与格 -is -is -is
宾格 -os -as -os
夺格 -is -is -is
呼格 -i -ae -a

而在词典中,给出形容词时会以词根的形式一同给出其三个性的形式。

sum

现在时

和英语一样,系动词sum和to be同为不规则动词,尽管其词干变化较大,还是能看出动词人称词尾变化的形式(即-m,-s,-st等),不过总体而言还是需要特别进行记忆的。

现在时变化列表如下

人称 单数 复数
不定式 esse esse
第一人称 sum(-m) sumus(-mus)
第二人称 es(-s) estis(-tis)
第三人称 est(-t) sunt(-nt)

谓语主格

sum(等系动词)连接的谓语部分的形容词和名词因为与主语有相近或者等同的地位,在数、格和性上需要与主语保持一致,因此尽管出现在谓语中但通常仍应该为主格。而对于主语中有多个性的情况,通常采取就近原则,但阳性往往具有支配地位。为了考察后一点,这里只记录一个例句。

Puer et puella sunt boni

The boy and girl are good.

注意到,由于Puer et puella整个做主语,系动词sunt使用了第三人称复数形式,而boni则为阳性复数主格,这也印证了“阳性往往具有支配地位”的说法,要理解起来,可能与汉语中第三人称复数代词“他们”的用法比较接近——只要指代的词中出现了男性就使用“他们”而非“她们”。

形容词作名词

这一部分的内容其实在3-3的翻译中多次出现。当时出现在句子

Semper avarus eget.

中,这里avarus作为名词,表示vir avarus,这个语法现象在英语中也很常见,不过在英语中我们往往认为这指代一类人,因此是复数;然而拉丁语中形容词与名词具有类似的变格的良好性质使得我们可以通过其变格分辨出其单复数,而在英语翻译时也需要相应的补上省略掉的词。

因为毕设和准备东大面试的关系一直没有捡起来,发现中期好像比想象的水的多……还是该多花点时间用来学习。

翻译

这次是第三课的古代名言部分.

Debetis, amici, de populo Romano cogitare.

You must, friends, think about the Roman people. (Cicero)

这里Debetis是第二人称复数,需要补上主语,而其后的amici则是第三人称复数,感觉可以理解为和debetis的隐藏主语呈同位语关系。因为friends已是复数而不需要补上冠词,否则加上my可能会更加通顺。

Maecenas, amicus Augusti, me in numero amicorum habet.

Maecenas, the friend of Augustus, hold me in the number of his friends. (Horace)

这里主语是一组同位语, Maecenas和amicus Augsti,而观察后面的结构,没有发现其他宾语,因此me应该是ego的宾格而非反身代词。整句话因为有一些比喻,初见稍微有些不太好理解。考虑到habet本身就有consider的意思,这里表示把我算作他朋友的数量从现在的视角来看也是某种双关了。

Libellus meus et sententiae meae vitas virorum monent.

My little book and my thoughts advise lives of men. (Phaedrus)

该读读《费德鲁斯篇》了

Pauci viri sapientiae student.

Few men are eager for wisdom. (Cicero)

studere也是study和studious等词的词源之一……说些题外话,确实学生生涯中最重要的不是学到的东西有什么用,而是对智慧的渴求。这里Pauci的意思相比一些的a few更接近几乎没有的few.

Fortuna adversa virum magnae sapientiae non terret.

Adverse fortune does not terrify a man of great wisdom. (Horace)

注意补上man的冠词。

Cimon, vir magnae famae, magnam benevolentiam habet.

Cimon, a man of great fame, have great benevolence. (Nepos)

同样注意到vir也是主格,因此和Cimon是同位语,而其后两组形容词-名词短语分别为属格和宾格以区分。

Cimon这里指雅典政治家客蒙。

Semper avarus eget.

A greedy man is always in need. (Horace)

根据注释,这里avarus = vir avarus,通过形容词的变格仍然可以判断其对应的名词的格。

Nulla copia pecuniae avarum virum satiat.

No abundance of money satisfies a greedy man. (Seneca)

这里nulla和copia都是主格,感觉可以理解为No和abundance作同位语。另外,尽管在英语看起来abundance of money的主体是money,在这里主格的仍然是abundance,正如其实英语中做主语的也是abundance一样。

Pecunia avarum irritat, non satiat.

Money excites a greedy man, not satisfies. (Publilius Syrus)

这里是动词的同位语,同样irritat和satiat保持了位的一致。

Secrete amicos admone; lauda palam.

Secretly warn (your) friends; praise (them) openly. (Publilius Syrus)

这里则是动词和修饰其的副词做同位语,共用共通的宾语amicos和隐藏的第二人称主语。

Modum tenere debemus.

We must maintain moderation. (Seneca)

事实上Few people manage to maintain moderation(

The Grass Is Always Greener.

Agricola et vitam et fortunam nautae saepe laudat; nauta magnam fortunam et vitam poetae saepe laudat; et poeta vitam et agros agricolae laudat. Sine philosophia avari viri de pecunia semper cogitant: multam pecuniam habent, sed nihil virum avarum satiat.

The farmer often praise both the life and fortune of the sailor; the sailor often praise the great fortune and life of the poet; and the poet praise the lives and farms of the farmer. Without love of wisdom, greedy men always think of money: (they) have much money, but no greedy men are satisfied.

首先说最后一句,其实纯粹从语法角度来说最后的主语应该是上一句的宾语"much money",且整句话是主动态,但是个人觉得这里用被动语态会让句子更通顺一些。这个句子翻译的难点在大量的并列。尤其是刚映入眼帘的两个et:第一眼见到时就像把agricola和vitam以及fortunam并列,但是后者是宾格,而前者是主格,因此这里的用法更类似与both…and…,或者考虑日语的话…と…と的形式,即虽然有两个et,但只存在一组并列关系。而第二个分句仅有一个et,更应征了第一分句的结构。第三分句的第二个et与之前的相仿,但是其第一个et却出现在句首,应当表示整个分句的并列关系。因此,在梳理并列关系时,最关键的一点还是呈并列关系的词都是平行的,因此必须有相同的格和位,考虑到这一点之后就不容易弄错了。

前言

最近准备东大IME项目面试,正在读Automatic Speech Recognition,在HMM的部分中遇到了一些比较复杂的数学过程,这里简单写一些笔记。

背景知识

前向概率:

αt(i)=P(qt=i,o1t),t=1,...,T\alpha_t(i)=P(q_t=i,o^t_1), t=1,...,T

后向概率:

βt(i)=P(ot+1Tqt=i),t=1,...,T1\beta_t(i)=P(o^T_{t+1}|q_t=i), t=1,...,T-1

其中oabo_a^b表示观测序列(oa,oa+1,...,ob)(o_a,o_{a+1},...,o_b)

利用前向和后向概率可以递推的计算马尔科夫链中的P(o1T)P(o_1^T),否则几乎其时间复杂度几乎不可接受。

其递推式为分别为

αt(j)=i=1Nαt1(i)aijbj(ot),t=2,3,...,T;j=1,2,...,N\alpha_t(j)=\sum^N_{i=1}\alpha_{t-1}(i)a_{ij}b_j(o_t), t=2,3,...,T; j=1,2,...,N

βt(i)=j=1Nβt+1(j)aijbj(ot+1),t=T1,T2,...;i=1,2,...,N\beta_t(i)=\sum^N_{j=1}\beta_{t+1}(j)a_{ij}b_j(o_{t+1}), t=T-1, T-2,...; i=1,2,...,N

另外,由定义我们不难得到初值。对于α\alpha,有

α1(i)=P(q1=i,o1)=P(q1=i)P(o1q1)=πibi(o1)\alpha_1(i) = P(q_1=i,o_1)=P(q_1=i)P(o_1|q_1)=\pi_ib_i(o_1)

对于β\beta,因为在定义域之外,我们选择βT(i)=1\beta_T(i)=1

其中,bi(o1)b_i(o_1)表示当前状态为ii时观测结果为o1o_1的概率,而πi\pi_i表示马尔科夫链的稳定分布(stationary distribution),即当tt\to \inftypi(t)p_i(t)的值

而定义了前向和后向概率后,我们可以将P(o1T)P(o_1^T)分解,有

P(qt=i,o1T)=P(qt=i,o1t,ot+1T)=P(qt=i,o1t)P(qt=i,ot+1To1t,qt=i)=P(qt=i,o1t)P(qt=i,ot+1T,qt=i)=αt(i)βt(i) \begin{aligned} P(q_t&=i,o_1^T)=P(q_t=i,o_1^t,o_{t+1}^T)\\ &=P(q_t=i,o_1^t)P(q_t=i,o^T_{t+1}|o_1^t,q_t=i)\\ &=P(q_t=i,o_1^t)P(q_t=i,o^T_{t+1},q_t=i)\\ &=\alpha_t(i)\beta_t(i) \end{aligned}

注意到第二行到第三行成立是因为在特定状态下观测是独立同分布(IID)的。

由此有

P(o1T)=i=1NP(qt=i,o1T)=i=1Nαt(i)βt(i)P(o_1^T)=\sum^N_{i=1}P(q_t=i,o^T_1)=\sum^N_{i=1}\alpha_t(i)\beta_t(i)

注意到这里的t,即α\alphaβ\beta的分断点是任意选择的,那么我们只要令t=Tt=T就有

P(o1T)=i=1NαT(i)P(o_1^T)=\sum^N_{i=1}\alpha_T(i)

EM算法

背景

考虑全数据y=o,hy={o,h},其中oo是观测到的数据,而hh是隐藏的变量。那么要找到参数θ\theta,我们需要最大化其对数似然函数logp(o;θ)log p(o;\theta),但是这个概率分布函数是相对难以计算的,因此EM算法试图迭代地处理全数据yy,再通过建立yyoo的映射o=g(y)o=g(y)来解决问题。而全数据的选择对于不同的问题通常具有其独特性。

而通过合理的选择隐数据hh,可以配合观测数据oo来构造全数据yy,这样可以简化似然估计的过程。

考虑以下条件期望

Q(θθ0)=Eho[logp(y;θ)o;θ0]=E[logp(o,h;θ)o;θ0]Q(\theta|\theta_0)=E_{h|o}[\log p(y;\theta)o;\theta_0] = E[\log p(o,h;\theta)|o;\theta_0]

hh在其所有的可能性上求和(如果是连续的则为积分)就可以得到似然函数的值。注意到这个似然函数的值是与θ0\theta_0相关的,相当于在初值θ0\theta_0的基础上计算得到了一个新的θ\theta,而可以保证θ\theta是收敛的,即$$Q(\theta|\theta_{k+1})\ge Q(\theta|\theta_k)$$,仅在θk\theta_k已是一个最大似然估计时取到等号。

Baum-Welch 算法

如在上一节中所述,对于EM算法我们需要一个观测数据和一个隐藏数据来构造全数据,对于HMM来说,分别为观测序列o1To^T_1和隐马尔科夫链状态序列q1Tq_1^T,代入公式则有

Q(θθ0)=E[logp(o1T,q1T;θ)o1T;θ0]Q(\theta|\theta_0)= E[\log p(o^T_1,q^T_1;\theta)|o^T_1;\theta_0]

E步骤

在E步骤中,需要将Q(θθ0)Q(\theta|\theta_0)化简到便于在M步骤中最大化的形式。将期望展开则有

Q(θθ0)=E[logp(o1T,q1T;θ)o1T;θ0]=q1TP(q1To1T,θ0)logP(o1T,q1Tθ) \begin{aligned} Q(\theta|\theta_0)&= E[\log p(o^T_1,q^T_1;\theta)|o^T_1;\theta_0]\\ &=\sum_{q_1^T}P(q_1^T|o_1^T,\theta_0)\log P(o_1^T,q_1^T|\theta) \end{aligned}

,其中θ\thetaθ0\theta_0表示当次和上一次迭代中的参数

由于在高斯混合HMM中,P(o1Tq1T)P(o_1^T|q_1^T)服从高斯分布,但其形式过于复杂,为了方便简写,我们令

Nt(i)=D2log(2π)12logΣi12(otμi)TΣ1i(otμi)N_t(i) = -\frac{D}{2}\log(2\pi)-\frac12\log|\Sigma_i|-\frac12(o_t-\mu_i)^\mathrm{T}\Sigma^-1_i(o_t-\mu_i)

logP(o1Tq1T)=t=1TNt(qt)\log P(o_1^T|q_1^T) = \sum_{t=1}^T N_t(q_t)

同时,由转移概率aija_{ij}的定义可以得到P(q1T)=t=1T1aqtqt+1P(q_1^T)=\prod_{t=1}^{T-1}a_{q_tq_{t+1}},因此有

logP(o1T,q1Tθ)=logP(o1Tq1T)P(q1T)=t=1TNt(qt)+t=1T1logaqtqt+1\log P(o_1^T,q_1^T|\theta) = \log P(o_1^T|q_1^T)P(q_1^T) = \sum_{t=1}^T N_t(q_t) + \sum_{t=1}^{T-1}\log a_{q_tq_{t+1}}

回代到QQ的定义式中有

Q(θθ0)=q1TP(q1To1T,θ0)t=1TNt(qt)+q1TP(q1To1T,θ0)t=1T1logaqtqt+1Q(\theta|\theta_0)=\sum_{q_1^T}P(q_1^T|o_1^T,\theta_0)\sum_{t=1}^T N_t(q_t) + \sum_{q_1^T}P(q_1^T|o_1^T,\theta_0)\sum_{t=1}^{T-1}\log a_{q_tq_{t+1}}

首先引入克罗内克δ\delta函数(Kronecker delta)

δij={1(i=j),0(ij)\delta_{ij} = \begin{cases} 1 & (i=j),\\ 0 & (i\neq j) \end{cases}

由于δ\delta仅在一个点上取到非00值,因此乘上它并不会改变函数的值。所以可以利用构造一个合适的δ\delta函数并调换乘项位置来化简QQ.

在本例中,对QQ的第一项有

Q1(θθ0)=i=1N{q1TP(q1To1T,θ0)t=1TNt(qt)}δqt,i=i=1N{q1TP(q1To1T,θ0)δqt,it=1TNt(qt)}=i=1Nt=1TP(qt=io1T,θ0)Nt(qt)\begin{aligned} Q_1(\theta|\theta_0)&=\sum^N_{i=1}\left\{\sum_{q^T_1}P(q_1^T|o_1^T,\theta_0)\sum^T_{t=1}N_t(q_t) \right\}\delta_{q_t,i}\\ &=\sum^N_{i=1}\left\{\sum_{q^T_1}P(q_1^T|o_1^T,\theta_0)\delta_{q_t,i}\sum^T_{t=1}N_t(q_t) \right\}\\ &=\sum^N_{i=1}\sum^T_{t=1}P(q_t=i|o_1^T,\theta_0)N_t(q_t)\\ \end{aligned}

同理,对QQ的第二项乘上δqt,iδqt+1,j\delta_{q_t,i}\delta_{q_{t+1},j}可得

Q2(θθ0)=i=1Nj=1Nt=1T1P(qt=i,qt+1=jo1T,θ0)logaijQ_2(\theta|\theta_0)=\sum^N_{i=1}\sum^N_{j=1}\sum^{T-1}_{t=1}P(q_t=i,q_{t+1}=j|o_1^T,\theta_0)\log a_{ij}

由此,不难注意到Q的两项分别只与高斯分布(Nt(I)N_t(I))和马尔科夫链(aija_{ij})有关,因此可以独立的最大化这两项。

Q1Q_1Q2Q_2中连加时使用的权分别为

γt(i)=P(qt=io1T,θ0)ξt(i,j)=P(qt=i,qt+1=jo1T,θ0)\begin{aligned} \gamma_t(i) &= P(q_t=i|o_1^T,\theta_0)\\ \xi_t(i,j) &= P(q_t=i, q_{t+1}=j|o_1^T,\theta_0) \end{aligned}

则由其定义,不难得出

ξt(i,j)=αt(i)βt+1(j)aijexp(Nt+1(j))P(o1Tθ0),t=1,2,...,T1.\xi_t(i,j) = \frac{\alpha_t(i)\beta_{t+1}(j)a_{ij}\exp(N_{t+1}(j))}{P(o_1^T|\theta_0)}, t=1,2,...,T-1.

由定义式,显然的,对ξt\xi_t在j上求和就可以得到γ\gamma

γt(i)=j=1Nξt(i,j),t=1,2,...,T1.\gamma_t(i)=\sum^N_{j=1}\xi_t(i,j), t=1,2,...,T-1.

又由定义可以直接得到

γT(i)=P(qT=io1T,θ0)=P(qt=i,o1Tθ0)P(o1Tθ0)=αT(i)P(o1Tθ0)\gamma_T(i)=P(q_T=i|o_1^T,\theta_0) = \frac{P(q_t=i,o_1^T|\theta_0)}{P(o_1^T|\theta_0)}=\frac{\alpha_T(i)}{P(o_1^T|\theta_0)}

由此将QQ化简为了只要对状态ii或状态对i,ji,j遍历的便于计算的形式,以在M步骤中处理。

M步骤

在M步骤中需要将E步骤中得到的Q1Q_1Q2Q_2的值在θ0\theta_0下最大化。对于Q2Q_2,令Q2aij=0\frac{\partial Q_2}{\partial a_{ij}}=0。由于有边界条件j=1Naij=1\sum^N_{j=1}a_{ij}=1,使用标准拉格朗日乘数法可以得到

a^=t=1T1ξt(i,j)t=1T1γt(i)\hat a=\frac{\sum^{T-1}_{t=1}\xi_t(i,j)}{\sum^{T-1}_{t=1}\gamma_t(i)}

具体计算步骤略去。

而对Q1Q_1,我们省掉与优化无关的常数项和常数系数后可以得到等价的目标函数

Q1(μi,Σi)=i=1Nt=1Trγt(i)(otμi)TΣ1i(otμi)12logΣiQ_1(\mu_i,\Sigma_i)=\sum^N_{i=1}\sum^{Tr}_{t=1}\gamma_t(i)(o_t-\mu_i)^\mathrm{T}\Sigma^-1_i(o_t-\mu_i)-\frac12\log|\Sigma_i|

省略的部分包括高斯分布中与Σ\Sigma无关的项,以及最后一项的系数(显然的有i=1Nγt(i)=1\sum^N_{i=1}\gamma_t(i)=1,那么再过一次求和之后仍然是常数,求导之后会被消去)

则相等于解

Q1Σi=0,i=1,2,...,N.\frac{\partial Q_1}{\partial\Sigma_i}=0, i=1,2,...,N.

K=Σ1K=\Sigma^-1,则对logΣi\log|\Sigma_i|项,klmk_{lm}的导数就是Σ\Sigma中对应的项,即σlm\sigma_{lm},于是单项的导数Q1klm=0\frac{\partial Q_1}{\partial k_{lm}}=0,即

t=1Tγt(i){12σlm12(otμi)l(otμi)m}=0\sum^T_{t=1}\gamma_t(i)\left\{\frac12\sigma_{lm}-\frac12(o_t-\mu_i)_l(o_t-\mu_i)_m\right\}=0

σlm\sigma_{lm}解出并写成矩阵形式有

Σ^i=t=1Tγt(i)(otμ^i)(otμ^i)Tt=1Tγt(i)\hat\Sigma_i = \frac{\sum^T_{t=1}\gamma_t(i)(o_t-\hat\mu_i)(o_t-\hat\mu_i)^\mathrm{T}}{\sum^T_{t=1}\gamma_t(i)}

从而有

μ^i=t=1Tγt(i)ott=1Tγ(i)\hat\mu_i=\frac{\sum^T_{t=1}\gamma_t(i)o_t}{\sum^T_{t=1}\gamma(i)}

Viterbi算法

Viterbi算法用于解码HMM状态,即,已知一个观测o1To_1^T,求出最可能的HMM状态序列q1Tq_1^T

其核心思想是动态规划,由于这个算法在OI中相当常见就不再赘述其背景了。

在Viterbi算法中,我们要最大化的量是

δi(t)=maxq1,q2,...,qt1P(o1t,q1t1,qt=i)\delta_i(t) = \mathop{max}\limits_{q1,q2,...,q_{t-1}} P(o_1^t,q_1^{t-1},q_t=i)

也就是对于观测序列o1to^t_1,假设t时刻之前的HMM状态序列为q1t1q_1^{t-1}的情况下,tt时刻状态为ii的概率。

而有了tt时刻的状态i的目标函数则可以简单的得到下一时刻状态j下的目标函数表达式,即

δj(t+1)=maxiδi(t)aijbj(ot+1)\delta_j(t+1) = \mathop{max}\limits_{i}\delta_i(t)a_{ij}b_j(o_{t+1})

这个式子的三项分别为:转移前的状态i的概率,从前状态i转移到该状态j的概率,以及对于相应的观测ot+1o_{t+1},该时刻处于状态j的概率。

由此迭代到T时刻就可以得到最大概率PP^*,以及所有时刻的状态路径q(t)q^*(t)

如果曾经有做过DP相关的题目这部分应该不难理解。

至此,利用EM算法和Viterbi算法,我们就完成了对HMM参数的估计以及隐参数HMM状态序列的解码。

按惯例生词表略过不表。

翻译

本课中,翻译的部分在原有的古代名言的基础上添加了练习的部分,故此先专注于练习。

Filium nautae Romani in agris videmus.

We see the Roman sailor’s son in the fields.

注意词序问题,首先filium是filius的单数宾格,并不能因为其在句首就认为是主语。继续观察,其后的nautae和Romani都是属格,分别修饰他们前面的词,in agris中,agris是复数夺格,两者构成介夺短语,最后是动词videmus, 为第一人称复数,因此这句话存在隐藏的主语we,需要将其补上。

Pueri puellas hodie vocant.

The boys call the girls today.

注意到vocant是第三人称复数形式,因此pueri在这里是复数主格作主语是较为合理的,应该不许要考虑pueri和puellas都是复数宾格做同位语的情况。

Sapientiam amicarum tuarum, O filia mea, semper laudat.

O My daughter, he/she always praises your (female) friends’ wistoms.

这里amicarum是阴性形式,而很微妙的是laudat是直陈式而不是命令式,因此似乎从语气上来讲laudat的主语并不是看起来很自然的my daughter。

Multi viri et feminae philosophiam antiquam conservant.

Many men and women conserve ancient phiphsophy.

没什么特别好说的

Si ira valet, O mi fili, saepe erramus et poenas damus.

If anger is strong, O my son, we often make a mistake and pay the penalty.

Fortuna viros magnos amat.

Fortuen loves great men.

注意magnos和viros一致是复数宾格,尽管他们的词尾分别是-ir和-us.

Agricola filiabus pecuniam dat.

The farmer gives (his) daugters money.

Without a few friends life is not strong.

Vita non valet sine amicis paucis.

第二课的词汇表中给出sine时记录了sine应加夺格,所以这里使用amicis和paucis。

Today you have much fame in your country.

Multas famas hodie in patria tua habes.

其实网上查到的答案里这句话都用的是单数形式,但是既然拉丁语中并不分可数和不可数,感觉much表示了多的含义之后还是应该使用复数形式?

如果是单数的话,这句话就为

Multi fami hodie in patria tua habes.

We see great fortune in your daughters’ lives, my friend.

Fortunam magnam in vitis filarum tua videmus, O amicus mea.

注意介词后的一致,尽管vitis是夺格,修饰它的filarum和tua还是应该按照自己的语法功能变为属格,这点与形容词不同。

He always gives my daughters and sons roses.

Filiabus et filiis meis rosas semper dat.

注意到如果直接变形的话filia和filius的与格都是filiis,也许是为了区分,filia的与格有特殊的变格,为filiabus. 注意到这里Meis是meus的与格,和filiabus和filiis保持一致。

因为太摸了,所以编号意义不太大了,改用课程序号-编号的格式命名。 Wherlock的第三课的内容关注第二变格法中阳性的部分,和第一变格法的阴性词相对,而中性词的内容则在之后的课程中涉及。

第二变格法

属于第二变格法的大多以-us结尾,但亦有少部分以-er结尾,其变形如下表

单数 复数
主格 -us/-er -i
属格 -i -orum
与格 -o -is
宾格 -um -os
夺格 -o -is
呼格 -e/-er -i

一致

形容词和其修饰的名词只需要在数和格上保持一致,而不要求其词尾完全相同:同属第二变格法的词就有-us/-er,并且由于第一变格法的词中也包含阳性词,可能会出现形容词与其修饰的名词甚至不属同一变格法的情况,例如agricola Romanus就属于这种情况,

同位语

拉丁语中同位语的概念与英语中类似,两个名词被放在一起作为等价,而如同形容词与名词的对应,同位语之间的数和格也需要对应。

词序

这部分内容在第一篇里就已经提过,这里就不再赘述了。总而言之拉丁语的词序变化并不会大规模的改变句意,而英语则相当依赖词序。同时也需要注意不能忽视变格和变位逐字的翻译拉丁文,容易出现让人啼笑皆非的错误。例如书中所举的以下例子。

Rosam puer puellae bellae dat.

The rose is giving the boy a pretty girl. (x)

尽管两句的词序是一样的(Rose - boy - girl - pretty - give), 但是下面的句子是没有意义的。因为Rosam是宾格,puellae是与格,puer是主格,无论词序怎么变,总有puer是主语,rosam是直接宾语而puellae是简介宾语。如果忽视了变格,想当然的将三个词按照出现的顺序认为rosa是主语,puella是直接宾语而puer是间接宾语的话,就会导致句意完全混乱。当然,改变词序还是会微妙的改变句子的语气的,例句中将Rosam放到最前面,让整个句子强调了男孩给出的是什么礼物这个信息。

短文

Catullus Bids His Girlfriend Farewell

Puella mea me non amat. Vale, puella! Catullus obdurat: poeta puellam non amat, puellam non vocat, formam puellae non laudat, puellae rosas non dat, et puellam non basiat! Ira mea est magna! Obduro, mea puella–sed sine te non valeo.

My girl does not love me. Goodbye, girl! Catullus is tough: the poet does not love the girl, does not call the girl, does not praise the girl’s beauty, does not give the girl roses, and does not kiss the girl! My anger is great! I am tough, my girl–but without you I am not well.

题目

Think of this brief passage as a miniature “drama” with three scenes; where does each scene begin and end?

  1. Puella mea – Vale
  2. Catullus obdurat – Ira mea
  3. Obduro – non valeo

It might be said that there are two Catulluses here, marked by the shift from first person to third and back to first: where does each shift occur, whaat is the intended effect, and how does the Catullus of the first and third scenes differ emotionally from the persona he imagines in the second?

摘抄一段教师用书里的原文吧.

Discuss the effect of the shift from first person [the real world, Catullus’ girlfriend has dropped him], to third person [a fantasy world, where Catullus imagines
himself as a tough guy who doesn’t need the girl and can get along just fine without her], back to first person [the fantasy collapses: I may be tough, Catullus confesses, but I can’t live without you].

拖了很久的剩下一半翻译

翻译

Immodica ira creat insaniam

Immodica ira creat insaniam

Excessive anger creates insanity.

没什么特别好说的,形容词immodica和名词ira保持主格的一致

Quid cogitas?–debemus iram vitare

Quid cogitas?–debemus iram vitare

What do you think? – We ought to avoid anger.

注意到问句前后人称的切换,两者的复数形式是同一的,但是现代英语中区分不出来。教师用书中将前一句翻译为了现在进行时,细想可能确实更合理一些。

Nulla avaritia sine poena est.

Nulla avaritia sine poena est.

No avarice is without penalty.

est前后的词都是主格形式。注意poena和poeta不要混淆了orz.

Me saevis catenis onerat.

Me saevis catenis onerat.

He oppresses me with cruel chains.

此处saevis和catenis都是夺格,表示onerat的方法,即使用残忍的锁链。翻译到英语时需要补上表示手段的介词with

Rotam fortunae non timent.

Rotam fortunae non timent.

They do not fear the wheel of fortune.

The girls save the poet’s life.tua est

The girls save the poet’s life.

Portae vitam poetae servant.

首先注意数量一致,谓语动词和主语the girls一致为第三人称复数形式,而宾语life为单数宾格,其修饰词poet’s为属格

Without philosophy we often go astray and pay the penalty.

Sine philosophia saepe erramus et poenas damus.

懒了,就不再写一遍原文了。poenas dare是词汇表中列出的习语,意味pay the penalty,dare本身是give的意思,其实两者的关联还比较好理解。在本句中,相应的也需要变为第一人称复数形式。

If your land is strong, nothing terrifies the sailors and you ought to praise your great fortune.

Si patria tua valte, nihil nautas terrat et magnam fortunam debes laudare.

教师用书中提到罗马人通常会省略在fortunam后面的tuam,因为这里的“你的命运”的限定关系已经由debes的形式很明确的表示了。当然我是漏了orz.另外也许应该将laudare放在debes之前,不过主观感觉可能这个语序也没有那么重要。

这个句子的结构已经很长了,不过其实只有一个条件状语从句和两个并列的简单短句,翻译的时候还是要注意不要慌乱,既然不考虑信达雅的话也许逐句慢慢翻译就好。

You often see the penalty of my anger and warn me.

Saepe poenam irae meae videtis et me monetis.

这里注意my anger整体是penalty的限定,因此my和anger都应该为属格而penalty为宾格,同时前后两句的动词see和warn都为第二人称复数

The ancient gate is large.

Porta antiqua magna est.

很懒,决定只做一半的翻译

翻译

Salve, O patria!

Salve, O patria!

Hello, o fatherland

¡Salve, Oh Patria!也是厄瓜多尔的国歌,在英语中被翻译为了Hail, Oh Fatherland!

也许对祖国这个对象来说hello确实不是一个够好的词

Fama et sententia volent

Fama et sententia volent

Rumor and thoughts move quickly.

这句话的意象其实不太好选择。翻到了教师用书,选择的是Rumor和opinion, 很合理。往上查到的其他结果都是选用了Fame,虽然意思不一样不过也很合理。

感觉就像是单独要翻译Ciao一样,不过也许只是我水平不够

Da veniam puellae, amabo te.

Da veniam puellae, amabo te.

Give pardon to the girl, thank you.

Clementia tua multas vitas servat.

Clementia tua multas vitas servat.

Your clemency saves many lives.

Multam pecuniam deportat.

Multam pecuniam deportat.

(He) carries away many money.

注意到这里Multam是宾格,因此需要补上省略的主语,根据谓语的第三人称单数形式可知。

Et fortunam et vitam antiquae patriae saepe laudas sed recusas.

Et fortunam et vitam antiquae patriae saepe laudas sed recusas.

you often praise but reject ancient fatherland’s fortune and life.

同上,但是这里是第二人称单数。

Me vitare turbam iubes.

Me vitare turbam iubes.

You order me to avoid the crowd.

同上,这里me和turbam都是宾格,而vitare是原型,因此根据iubes的形式补上主语You。 这个句子的结构稍微有些复杂最开始没看出来orz

Me philosophiae do.

Me philosophiae do.

I give myself to philosophy.

Me这里是反身代词,注意到philosophiae是与格,因此需要补上介词to

Philosophia est ars vitae.

Philosophia est ars vitae.

Philosophy is art’s life.

也许翻译成the life of art会更通顺一点

Sanam formam vitae conservate.

Sanam formam vitae conservate.

Keep the sound form of life.

注意到Conservate是命令态,而形容词Sanam与其修饰的名词Formam保持一致,都为宾格,且共通被属格的vitae修饰。

因为一些事情摸了一周orz

第一变格法

部分名词和形容词遵循第一变格法,根据其单数的属格词尾可以判断,遵循第一变格法的词为-ae

其变形为

单数 复数
主格 -a -ae
属格 -ae -arum
与格 -ae -is
宾格 -am -as
夺格 -a -is
呼格 -a -ae

又是一张需要背的表!学习语言真妙啊()

拉丁语的词具有词性,然而除了男孩/女孩这样显然是阳性或阴性的词以外,大多数时候性别只是一个语法概念。

属于第一变位法的词大多数都是阴性词。一些例外是罗马人认为应该由男人从事的职业,例如poeta(poet,诗人), nauta(sailor,水手), agricola(farmer,农夫), auriga(charioteer, 战车手), incola(inhabitant, 居民), pirata(pirate, 海盗)等

尽管这看起来是 一项规律,但是显然的我们不是罗马人,要做额外的关于“罗马人觉得什么职业该是男人从事的”大概实在是舍近求远,因此一些额外的记忆工作还是必要的。对于第一变位法来说,阳性和阴性也并不存在变为不一样的情况,相对来说记忆成本也会小一些。

当然了,作为一名卑劣的业余拉丁语学习者,任何现代的拉丁语词典都会带有词的性相关的信息。

形容词、一致、词序

英语中的形容词是没有屈折变化的,但是拉丁语中形容词需要在性、数、格上都与其所修饰的名词保持一致。

对于一个形容词修饰多个名词的情况,一般来讲与其最近的名词保持一致,书中提到存在其他的例外(阳性优先等),这里等我们碰到了再具体分析。

而从上来讲,形容词通常跟在名词之后,指示大小和数目的形容词例外。

语法与句法

从拉丁语来看上一篇中提到的例句,我们可以应用刚学到的知识对整体结构做一个分析。

The poet is giving the girl large roses (or is giving large roses to the girl).

Poeta puellae magnas rosas dat.

Poeta在这里是单数主格,做这句话的主语,而紧跟在其后的不是英语中的谓语结构,而是这句话的间接宾语puella,因此其变为与格形式puellae(-ae),有趣的是,这句话的谓语动词正是给/与(do/dat)

而直接主语rosas则为复数宾格,因此修饰它的形容词magnas也是复数宾格形式,因此我们也看知道诗人送花的对象并不是一位巨大的女孩。同时,注意到表示大小的magnas的位置在被修饰的rosas之前。

这个句子的最后一个成分是谓语动词dat, 为do的第三人称单数现在时直陈式,与Poeta的数人称和数保持一致。

The girls are giving the poet’s roses to the sailors.

Puellae nautis rosas poetae dant.

对于第二个例句,主语是Puellae,为主格复数形式,nautis和第一句一样为复数与格形式作为间接宾语。只不过这里修饰rosas的词从形容词变成了poeta的属格。

话说这个句子真是个悲伤的故事……

  1. Without money the girls’ country (or the country of the girls) is not strong.

Patria puellarum sine pecunia non valet.

首先主语仍是单数主格的Patria, 有趣的是,尽管Patria的词源可能是Pater(father), 但是它是阴性词。关于Fatherland和Motherland的文化区分,有一篇简单的介绍文章

而修饰主语的是puellarum的复数属格。在这之后是一个夺格介词短语, sine是介词,意为without, 而pecunia作为介词的宾语为单数夺格,这个词组在此表示手段,因此使用夺格。

最后的谓语valet为第三人称单数。

总结

由于拉丁语的语序并不固定,直接通过其句法理解句意可能会遇到一些困难,此时往往需要词法的辅助;而词的某些变格却又有类似的形式,尽管可能存在一些长音上的区别,但是在现代的书写中并不总是会记有长音符号,此时又需要结合上下文来判断。因此阅读拉丁语是一个整体的过程,这也为初学者带来了许多挑战。