2009/12/20

_lognostics: 第2言語語彙習得研究者のためのツールを提供するサイト

;;
などというすごいものを見つけてしまいました。
ここ↓です。
_lognostics

私は自分の研究で、語彙使用の多様化を示す'D'という指標を調べていてたどりつきました。
ここのサイトでは、そのDを算出するための、その名も'D_Tools'というソフトを、
無料で配布されています。

# プログラムはこちら↓
# Free software from _lognostics

この'D'という指標、もともとはMcWhinnyらのCHILDESプロジェクトで使用されはじめたもの。
type-token ratio に代わる新しい指標として、
あっちこっちで使用されています。

別に私は新しいもん好き、アメリカの研究者の信者ってわけではないのですが、
でも type-token ratio はやはり問題があるし、
自分の研究で使用できる指標として、指標'D'にはちょっと期待しております。

ただ、CHILDESで公開されているプログラムは、
CHILDES専用のCHATという形式で記述されたデータしか分析できません。
さらに、どうも日本語のような2bite文字は受けつけてくれないようなのです。
(↑これは誤解かも知れませんが)

それで、計算方法を理解して、自分でプログラムを書いて'D'を算出しようと、
公開されているCHILDESの公式分析プログラムである、
'CLAN'のプログラム群の中の'vocd'というプログラムのソースコードを研究していたのですが、
どうも計算が合いませんでした。

困ってしまっている時に、'D_Tools'を発見。
急遽使わせてもらうことにしました。

本当に日本語が処理できているのか、
これから試してみなければなりませんが、
なんとなく動いているようです。
ありがたく、使わせていただきたいと思います。

それにしても、なんでvocd計算が合わないかな。
今晩、もうすこしがんばってみます。

2009/12/19

TOEICで日本に負けたのが「恥辱」ですか、そうですか

;;
台湾に住んでいると「台湾のほうが日本より英語が強いから国際的だ」みたいな論説をよく聞きます。
私はもちろん「できない人」なわけですが、
でも日本人にも英語できる人多いのに、
なんでそんなふうに思うようになったのかよく分かりません。
おそらく台湾に英語のできる日本人があまり来なかったためでしょう。
そういう人々はふつうは台湾に長くいませんから。(例外あり!)
でもとにかく「日本人は英語がだめ」というのは台湾の常識です。

そんな台湾でこんなニュースが。
台灣多益測驗輸韓日 朱立倫:奇恥大辱

英語で韓国や、あろうことか日本にまで負けたのが「とても大きな恥辱」なのだそうです。

勝手に見下しておいて、勝手に負け(?)と決めてくやしがっている

という、とても失礼な話なのではないかと思います。

ただ、この問題は個人的に興味深い問題を2つ含んでいます。
1つは「英語の早期教育の成否」についてです。
今日日の台湾の若い学生さんたちは、
幼稚園では普通にバイリンガル幼稚園に行っていた人たちだと思います。
そして小学校では低学年から英語が必修だったと思います。
こうした早期教育がTOEICの点に結びついていないという点は、
外国語習得論的に、非常に興味があります。
(TOEICの点数だけが英語の運用能力ではないという前提で)

また、日本でも若者の学力低下が報告されていますが、
同様の傾向が台湾でも発生しているのかも知れません。
こちらも台湾で教鞭を取るものとしては大変興味深い話です。

それにしても「台湾は負けるわけにはいかない」という話なのですが、
いったい何と戦っているのでしょうか。
英語の呪縛というのは、それほど強いものなのですね。

♪飾りじゃないのよ統計は、はっはーん

「研究には統計が必要だ!」
「時代の流れだ!」「実証研究だ!」
「査読者にt検定をやれと言われた!」

などなど、様々な理由で、台湾の日本語研究の世界では統計が必要とされているんだそうです。

それで、私ごときが統計の質問に偉そうに答えるハメになるのですが、
どうもいまひとつスッキリしません。

質問しにくる方の中には、明らかに「真剣に理解しようとされる方」がいらっしゃいます。
そういう方にはよろこんでお手伝いさせていただいています。
が、努力しないで、何とか自分の研究に間に合わせようとしたり、
私に分析の一切をやらせようとしたりする人もいます。

お手伝いするのは構いません。(本当は忙しいからイヤだけど)
でも、こういう人が多くて困っています。
1) データを取ってから相談に来る人
2) 私の都合を考えてくれない人
3) 説明しても理解しようとせず、「難しい」と文句を言う人

中にはちょっとイヤな人もいて、
1) 何かの質問を私にする
2) 私の説明をまじめにフンフンと聞いて私を褒める:「さすがはKikukさん!」
(でもたぶん目的は私を褒めることで、理解することではない)
3) それで最終的にはその質問とはあまり関係のない自分の分析を押しつけようとする

まあイヤな人の目的というのは
「統計を自分の論文のアクセサリーにする」ことだと思います。
自分の研究に自信がないので、せめて数字でページ数を増やしてごまかそう、
ってことだと思います。

でも、自信のない論文は、数字があってもなくても同じでしょう。
逆に、統計なんか使っていなくても、有意義な研究なんてたくさんあります。
推計学を使用する研究など、言語研究、言語教育研究の数々の方法の、
ほんの1部でしかありません。

それが必要以上にクローズアップされ、
重要視されることに大変な違和感を覚えます。
自分が統計ができないのに「統計を使え」という査読者にも、
自分が統計ができるから「統計を使え」という査読者にも、
違和感を感じます。

「時代の流れなんだよ!」
という声も聞きますが、何ですか?時代の流れって?
何の脈絡もなく「t検定やりましたー」っていうのが今の流行なのですか?
今の流行だから、私があなたの代りに分析をしなければならないだなんて、
私にとっては何のメリットもない話です。

#私がとても(気に入っている|尊敬している)人は別です、手伝います!
#っていうか、手伝わせてください!

今、私の所属している博士課程に「統計の授業を設けよう」というような話も出ているそうです。
でも、博士課程で勉強することではないような気がするので、これにも違和感。
ちょっと話を聞いただけで、すぐに使えるようには絶対ならないし。

(なぜか、半年とか1年間講義を聞けば使えるだろうと考えられているようで、
不思議でしかたがないのですが)

統計使いたい人は、調査法なり実験法なりを心理学とか社会学の学部の授業で聴講して、
実際にデータを集めて計算してみて、じっくり身につければいいんです。
それができなければ、誰かにごはんをごちそうしてやってもらうか、
統計の使用をしなくてもいい研究をすればいいんです。

と思うのですが、時代遅れですか?

2009/12/14

交流協会の齋藤代表に感謝の投書(自由時報)

;;
交流協会の齋藤代表の辞任についてです。
馬総統は喜んでいると思います。
「私に逆らえば更迭されるんですよ、気をつけてくださいね」

でも、そうじゃなくて「台湾は法的には中華民国の領土ではない」という「台湾地位未定論」は事実でしょ?

まあ、中華人民共和国的には都合が悪いので必死なんだと思いますが。

そんな中、台湾を去る齋藤代表に感謝のエールを発見。
齋藤大使 閣下,您好!(自由時報)
齋藤代表の辞任(と、それにまつわるドタバタ)を、
台湾人の立場から重く考える方もいらっしゃるのだと、
同志を発見したような気分。

「世界で1番人口が多い隣国、中国との付き合いは非常に大事だ」(by現首相)

隣国との付き合い大事=首相(時事ドットコム)

不快感……

「世界で1番人口が多い」だから「特別扱いが必要」?

#「鯨は(美しい|知能が高い)生物だから食べてはダメ」
# っていうのとよく似た話か?

んじゃあ、人口少ない国はどうすんの?

これが一国の首相の発言ですからね。
民主党って、(以下略)

「反対なら辞表を」

小沢氏、宮内庁長官「反対なら辞表を」 天皇陛下・中国副主席会見(日経ネット)

不快感……
公務員は、政府の方針に異議を唱える権利はないってか!

民主党って、(以下略)

再掲:Emacs文字起しの味方、mpg123-remote.el

ついでと言っては何ですがmpg123.el がらみでもう1本。
これがあれば、手元でmp3(oggも可)を「ちょっと巻き戻し」などしながら、
文字起しの作業ができてしまう、mpg123-remote.el をご紹介します。

実はこのエントリーは、前のサーバーの時代に書いたものですが、
ブログとしては消滅してしまったので、こちらにそのまま再掲します。


---------------------------------
(2009年4月)
前回の続きです。
mpg123.elは大変便利なのですが、
それをさらに便利にしてくれるのがmpg123-remote.elです。
これは、Emacs上でgnuservというものを立ち上げておけば、

1) mpg123のバッファ以外からもmpg123の操作が可能
2) さらにあろうことか、設定次第でEmacsの外からも操作可能

というものです。
私の文字起しで使うのははEmacsだけとは限らないので、
こういう機能を探しておりました。

# というか、この機能が使えるのでmpg123.elの導入を決めたのですが。

さて、インストールですが、
まずgnuservをインストールします。端末から以下のコマンドを実行します。
これをインストールしないと動きません。

$ sudo apt-get install gnuserv

次にここからmpg123-remote.elをもらって、
site-lispディレクトリにコピーします。

# 私のUbuntuの場合は次の場所です。
/usr/share/emacs-snapshot/site-lisp/mpg123-el/

.emacs.el には以下のように書いておきます。

(gnuserv-start)
(load "mpg123-remote")

;お好みで以下のように書いておけば、M-o で再生と停止がトグルできます。
(global-set-key "\M-o" 'remote-mpg123-pause) ;mpg123 Pause/play toggle

Emacsの外のコマンドラインから操作する場合は、
以下のコマンドを実行すれば再生と停止をコントロールできます。

$ gnuclient -batch -f "remote-mpg123-pause"

すごいです。すごいですよね!

さて、私の目的は文字起しなので、
書き取れなかった所は音声を「巻き戻す」必要があります。
mpg123.el には mpg123-backward-10 という関数が準備されているので、
mpg123-remote.el の関数を加工して
「10秒巻き戻しを外部から行う関数」を作りました。以下です。

(defun remote-mpg123-backward-10 ()
  "Backard 10 sec"
  (interactive)
  (if (mpg123-active-p)
      (save-excursion
        (set-buffer mpg123*buffer)
        (mpg123-backward-10 1)))) ;←ここ変えただけ

これは.emacs の中でも、mpg123-remote.elの中でも、
どこにでも書いておけばいいみたいです。
この関数を適当なキーにバインドしてやれば、
mpg123のバッファ以外から操作ができました。
私のパソコンはF6のキーが空いていたので、そこに登録しました。
.emacsに以下のように書きました。

(global-set-key [f6] 'remote-mpg123-backward-10)

でも、原因が分からないのですが、
これをEmacsの外から実行しようとして、
以下のコマンドを端末から入力すると、
肝心要のgnuserveが落ちてしまいます。
これが落ちると、もうmpg123-remote.elは機能しません。

$ gnuclient -batch -f "remote-mpg123-backward-10"

いろいろと試行錯誤したあげく、
gnuservと同時にemacsserverも起動して、

*再生/停止の remote-mpg123-pause はgnuclientから
*巻き戻しの remote-mpg123-backward-10 はemacsclientから

という(面倒な)方法に落ち着きました。
こんな感じです。

*再生/停止
$ gnuclient -batch -f "remote-mpg123-pause"
*巻き戻し
$ emacsclient -e "(remote-mpg123-backward-10)"

これを Ubuntu Tweak (Ubuntu の便利設定GUIツール)で、
キーボードショートカットとして登録してやれば、
うまく機能しました。めでたしめでたし。

2009/12/13

mpg123.el で ogg を再生したいだけなのに

使用環境: Emacs-snapshot (23.0.60) on Ubuntu 8.04

文字起しの作業をするのに、以前はmpg123.el と mpg123-remote.el で、
mp3形式のものを再生していました。
それはそれは快適な文字起し作業だったのですが、今回、
「mp3じゃなくて、ogg 形式ってのが、'ふりー'で'おーぷんそーす'でいいらしい!」
ということで、Emacsで再生しようとしてゴニョゴニョしていたのですが、
はまってしまって、かなりの時間を原因の探索に費してしまいました。
結論から言って、mpg123.elのバージョンの問題でした。

1) 新しいmpg123.el (2009年版)をインストールして、
2) .emacs.el に次のように書く


;===================================
; mpg123
;===================================
(setq mpg123-lazy-check "\\(\\.ogg$\\|\\.mp3\\)")
(setq mpg123-mpg123-command "mpg123") ; mpg123は事前に要インスト
(setq mpg123-ogg123-command "ogg123") ; ogg123も要インスト
(setq mpg123-file-name-coding-system 'utf-8)
(setq mpg123-process-coding-system "utf-8")
;===================================


文字起しの作業が終わってから気づくんだもんな!
やれやれだ。

# ひょっとしたら、以前mpg123.elをインストールした際に、
mpg123.elの文字コード周りをゴニョゴニョしたのが原因だったのかも知れん。
配布パッケージはいじるもんじゃないな。

# Ogg 形式についての詳しい説明ページを見つけました。
http://www.babylonic.com/we/ogg.htm

2009/12/12

再起動

2009年夏、お世話になっていたサーバーがトラブルのため使用不能となり、
そのまま放置していた菊川亭なのですが、
このたびまた書きたいことがいろいろできて、
こうして再起動することになりました。

以前Doblog時代に書いていたエントリーは文字だけ残っていますが、
これをこちらにインポートするかどうかは未定です。

それから、Doblog以降、2009年までのエントリーは、
全て消えてしまいました!
コメントなどいただいていた皆様、
申し訳ありません!

ということで、まだまだ寒くない台湾の12月、
菊川亭日常、3度のスタートと相なります。
勝手なことをつぶやくだけですが、
どうぞみなさま、よろしくお願い申し上げます!

# ところで、Bloggerを選んだ理由は、
「EmacsにBlogger投稿モードがあるようなので」という理由でした(笑)