英語学習法:1日30分90日で159の例文を覚えて英語をネイティブ並にする勉強方法 英語学習法:1日30分90日で159の例文を覚えて英語をネイティブ並にする勉強方法

2007年7月26日(木曜日)

検索エンジン・コーパスの注意点 3 〜 書き手について

カテゴリー: - 満蔵 @ 09時31分50秒

 今回は、検索結果に出てくるページを見ていくことにしましょう。

 まず、前回アメリカのドメイン(というより、誰でも使えるようになって
 いる)の中で、非ネイティブ率が低そうなドメインです。

   .gov…政府機関向け
   .mil…軍事機関向け
   .edu…教育機関向け

 もちろん、教育機関には留学生もいますし、外国から招聘された教員もい
 ますから、彼らの英語は非ネイティブなわけです。

 それでも、これらのページの英語は割合ネイティブの英語だと思って読ん
 でいいわけです。

 その他、民間だと出版社や雑誌社などは問題が少ないでしょう。

 アナウンサーやライターはいいと思います。
 インタビュー記事は、話し手によります。
 詩人の英語や、歌手の英語は、正しい英語というより芸術やエンターテイ
 ンメントの英語ですね。

 このように、ネイティブなら正しい英語の文章かといえば、もちろんそう
 ではありません。

 あなたも試してみればわかりますが、ワードなどで自分の書いた日本語の
 文章をチェックしてみてください。

 かなりチェックが入りませんでしたか?

 私は必ず訂正するように警告を受けます。

 要はネイティブでも、よほどの人でない限り正しい言葉を使っているとは
 限らないということです。

 このように見ていくと、結局書き手が誰であるか、そしてその人の英語力
 がどの程度かを個別に見ていくことが必要だということがわかります。

 言葉というものは変化していくものですが、英語は私たちのような非ネイ
 ティブも多用しますので、より変化が起こりやすい言語なのかもしれませ
 ん。

 そして、ネット上で非ネイティブがこぞって今までとは違うフレーズを使
 い始めると、それがスタンダードになる可能性もあります。

 検索エンジンをコーパスとして考えた場合、その変化を一番早く反映し
 たデータベースであるということができます。

 次回はまた、「あなたに必要な単語数」の話に戻ります。


2007年7月25日(水曜日)

検索エンジン・コーパスの注意点 2 〜 ドメインについて

カテゴリー: - 満蔵 @ 09時27分40秒

 ドメイン(domain)とは、「インターネット上にあるコンピュータを指す
 識別子」です。
 わかりやすく言うと、インターネット上の「住所」です。

 今回注目してほしいのは、一番右側の”.com"”.uk"の部分です。

 これは、アメリカ以外は、国を表します。

 .ac Ascension Island アセンション島(英)
 .cn China 中国
 .gb United Kingdom of Great Britain and Northern Ireland イギリス
 .jp Japan 日本
 .nz New Zealand ニュージーランド
 .ru Russian Federation ロシア連邦
 .uk United Kingdom イギリス ※.gbよりも使われている

 ※出典: フリー百科事典『ウィキペディア(Wikipedia)』

 アメリカは.comや.net、.orgのように国の識別がありません。

 これは、元々インターネットのドメインがアメリカで始まったもので、世
 界中で使う、つまり国別に識別する必要があるという意識がなかったから
 ではないかと思います。

 そのため、.comなどはアメリカばかりではなく、世界中の企業や個人が使
 う習慣があったので、特にドメインの所有者の国籍に制限はありません。

 これがどういうことかといえば、検索エンジンで英語のフレーズを検索す
 る際、アメリカつまり.comや.orgを選択しても、日本や中国やロシア国籍
 の企業、個人が作ったサイトが混じっているということです。

 その点、他の国籍別ドメインはある程度制限がありますので、.comほど非
 英語ネイティブが混じっている可能性は少ないです。

 次回は、書き手が誰であるか、ネイティブの英語について説明します。


2007年7月24日(火曜日)

検索エンジン・コーパスの注意点 1 〜 検索エンジンについて

カテゴリー: - 満蔵 @ 09時14分38秒

 前回は Google を例にとって、コーパス的な使い方を説明しました。

 今日はその注意点ですが、まずは検索エンジンそのものについて考えてみ
 ましょう。

 検索エンジンの代表格は、GoogleやYahoo!、MSNといったところですが、
 それぞれの検索エンジンの検索結果、成り立ちや運営方針は異なります。

 例えば、Googleはプログラムによって、ネット上のサイトの情報を収集し、
 インデックスする方法で検索エンジンの雄となりました。

 逆にYahoo!は、検索エンジンとしては後発で、人によるサイトの登録をメ
 インとしたディレクトリを中心にしてきました。

 そう考えると、Googleは純粋にネット上に存在する情報を収集していますが、
 Yahoo!は自社のディレクトリを中心に情報収集しているとも考えられます。

 しかし、Googleのプログラムは類似した情報をカットしたり(なぜなら、
 他人のサイトを違法にコピーしたサイトを作る人が存在するからです)、
 過剰なSEO対策(検索エンジンの検索結果で上位に表示されるようにする
 対策)を施したサイトをインデックスから削除したりする機能を持ってい
 ると言われます。

 要するに、どの検索エンジンもネット上の情報を完全に反映しているとい
 うわけではないのです。

 次回は、.comや.ukといったドメインについて説明します。


2007年7月22日(日曜日)

EVS順位9136の英単語、corpus とは?

カテゴリー: - 満蔵 @ 09時10分52秒

 今まで、GSLでは the Brown Corpus、AWLでは the Academic Corpus とい
 う名前が出てきましたが、一体何なのでしょう。
 
 corpus とは、「a collection of written or spoken texts[ox]」、つまり、
 「書かれたあるいは話された文章を集めたもの」です。

 具体的には、文学全集だったり、ネッシーに関する研究資料大全だったり、
 何でもいいのですがかなり多くの文書を集めたものということです。

 こういう英単語リストに関する corpus の場合は、コンピュータに蓄積さ
 れている電子化された言語データのことです。

 もちろん、英語だけではなくて日本語や他の国の言語のコーパスも存在し
 ます。

 その元になるデータは、本や雑誌、インタビューなど、コーパス作成者の
 意図した範囲でいろいろなものが集められています。

 元々コンピュータで作成された文章はいいのでしょうが、紙に書かれた文
 字やオーディオメディアに録音された音声の場合、電子化するのがとても
 大変そうです。

 ビジネスコンビニなんかで、資料の電子化などを頼むと、「ええっ」とい
 う金額を取られます。

 また、それらの文章には著作権がありますから、取り扱い要注意です。コ
 ーパスはコンピュータでいろいろな検索ができますから、日常でほとんど
 使わないような有名な映画のセリフが検索結果として出てきたら、問題に
 なりそうです。

 そのあたりは大学や大きな出版社が取り組んでいることなので、クリアさ
 れているのでしょう。そういうわけで、コーパスは巨大なブラックボック
 スだったりしそうです。

 ※著作権に関する記述は推測ですので、一切内容を保証しません。

 コーパスのいくつかを、EVSのレポートで紹介する予定ですが、まん単で
 はもっとも手軽に利用できるコーパスをご紹介することにしましょう。

 次回はブラウザを立ち上げてお待ちください。


2007年7月21日(土曜日)

the Academic Word Listの使い方

カテゴリー: - 満蔵 @ 09時37分51秒

 ’the Academic Word List’(AWL)は、大学での勉強のために作られました。
 そのためか、ヘッドワードを一瞥すると知らない単語もちらほらと見受け
 られます。
 サブリストを見ると、そのワードファミリーには圧倒されます。

 学習の仕方については、サイト内で詳しく書いてあるので割愛しますが、
 私がざっと見て気づいた注意点が2つあります。

 1つは、GSLをマスターする前にAWLに取り組んでも効果が薄いことです。

 AWLは、GSLの単語をマスターしていることを前提にしています。
 GSLで8割のテキストを読みこなせて、それにAWLの単語を覚えることで
 95%のテキストを読みこなせるというわけです。

 つまり、仮にGSLの単語を全部知らないとすれば、単純計算するとAWLをマ
 スターしても、5%しか理解できないということです。

 ※実際は、GSLが全ての基本単語を含んでいるわけではありません。
  ’an’や’two’といった単語はGSLには含まれていません。

 そういうわけで、まずはGSLをマスターしてからAWLに取り組みましょう。

 もう一つは、アルファベット順に覚えるものではないということです。

 GSLのように、ヘッドワードだけをやろうとした場合、ヘッドワードのリ
 ストの右側の数字を見逃しがちかもしれません。
 この数字は、1が一番頻出で、2が次というように、段々と出現頻度が落
 ちてきます。

 つまり、このサブリストのナンバーが小さい順に取り組んでいけば、最も
 効率がいいというわけです。

 ’the Academic Word List’、英語圏の大学に行く時には是非マスターして
 おきたいですね。


2007年7月20日(金曜日)

the Academic Word List

カテゴリー: - 満蔵 @ 09時33分10秒

 今日は、GSLの次のリストをご紹介します。

 その前に、GSLを覚えていれば、どの程度の英文を読みこなすことができ
 るのでしょうか。

 これは、いろいろ英語の偉い人が言っているのを調べると、8割前後だと
 推測されます。
 実際には85%や90%と言っている人もいますが、最近ではインターネ
 ットで最新の現代用語が混じった文章を読むことも多いですし、大体8割
 前後と思っていた方がいいかもしれません。

 では、この8割というのはどういう数字なのでしょう。

 英単語は大体50万語くらいあるそうですから、0.45%覚えただけで
 8割の英文がわかるというのはお得な気がします。

 しかし、ネイティブの最低平均10000語に比すると、2284語とい
 うのは22.8%にあたります。

 ここであなたも80:20の法則、パレートの法則を思い出したかもしれ
 ません。

 「英文の8割は、2割の基本単語によって構成される」

 みたいな感じです。

 しかし、残った2割のわからない単語が英文を理解するのに重要だったり
 するのもまた真実です。

 そこで、GSLの次のレベルの単語リストが必要になってきます。

 ’the Academic Word List’がそれです。

   http://www.vuw.ac.nz/lals/research/awl/

 次回はこの’the Academic Word List’(AWL)の説明をします。


2007年7月19日(木曜日)

GSLの上位の定番リスト

カテゴリー: - 満蔵 @ 09時27分34秒

 もうGSLはチェックしましたか。
 もしくは、チェックする時間をスケジューリングしたでしょうか。

 「単語を覚える」というと、どの単語集がいいとか覚え方についての議論
 が始まります。
 その原因は「楽をしたい」「失敗したくない」ということではないかと思
 います。

 これは言い換えれば、「効率よく」「継続したい」ということです。
 みんなやる気はあるのですが、過去に失敗したことがあるのか面倒くさい
 からか、踏ん切りがつかないでいるのです。

 こう考えてみてください。

 1日1単語ずつ毎日365日で365個覚えて、10年間継続した人。
 10年間何もせず、最後の1日で記憶術を使って10年分の単語を覚えた人。

 どちらも合計で3650語の単語を覚えています。

 効率から言えば、後者の1日で単語を覚えた人の方が勝ちです。
 しかし、前者の人は最初は365語だけですが、徐々に語彙力を増やしな
 がら覚えた単語を10年間も日常で仕事で役に立てることができました。

 どちらが英語を使うということで得をしているか明らかですね。

 ちなみに、ネイティブであっても、使わない単語はどんどん忘れていきます。

 異業種に転職をした人の話を聞くと、「前の仕事の業界用語なんか忘れて
 しまう」というのです。そして、「新しい仕事の業界用語を覚えないと、
 仕事にならない」そうなのです。

 どうやってマスターするのかといえば、「仕事でどんどん使う」「専門書
 を読む」「業界紙を購読する」といった手段を使って、徐々に覚えていく
 そうです。

 つまり、記憶術を使ったり、単語カードを使うわけではありません。

 「自然によく使う単語から覚えていく」=「出現頻度順に覚えていく」わ
 けです。

 GSLをはじめ、多くの英単語リストは出現頻度を重視しています。
 これは非ネイティブの英語学習者にとって、語彙力の不足から多くの英文
 を読むのが難しいという事情に起因しています。

 そこで、人工的に「出現頻度順に覚えていく」方法を採ることによって、
 「自然によく使う単語から覚えていく」のと同じ状態を短時間で実現して
 いくわけです。

 では、ネイティブと同じように英文を読みながら、あるいはある程度のレ
 ベルの会話をしながら覚えていくには、どの程度の単語数が必要なのでし
 ょうか。

 1つの基準がGSLの2284語です。
 そして、さらに上位の定番リストも存在します。

 次回はそのリストをご紹介します。


2007年7月18日(水曜日)

GSLであなたの語彙力をチェックしましたか

カテゴリー: - 満蔵 @ 09時23分40秒

 「あなたに必要な単語数とは」という話題で創刊号をはじめました。

 そして、英語を母国語としているネイティブの単語数は約1万から2万語
 とされているということをお伝えしました。

 最終的には1万語を覚えるにしても、突然全部を覚えるのは難しいので、
 何とかならないかという話でした。

 そこで、出現頻度順の単語リストを活用しようという話でした。

 ベースボールの守備位置を例に、英単語学習を考えてみましたね。

   1.球がよく飛んでくるところには人を多く配置する
   →よく使われる単語はちゃんと覚えておく

   2.球があまり飛んでこないところには人を少なくする
   →あまり使われない単語はそれなりに覚えておく

   3.もうどうしようもないところに球が飛んだらあきらめる
    (ホームラン)
   →あきらめて知っている人に尋ねるか調べましょう

 この3つの区別をしっかりして対策をすれば、1万語全てを覚えなくても
 いい、あるいは1万語をよく出る順番で覚えていけるのではないかという
 ことでした。
 ※もっとも、どの1万語を選ぶかという問題が残されているのですが。

 実際にそういう試みはなされていて、「1.よく使われる単語はちゃんと
 覚えておく」レベルの単語リストとして、GSLという有名なリストがある
 という話でした。

 もう入手しましたね。
 そして、ちゃんとチェックしましたか。

    http://jbauman.com/gsl.html

 どんなに「役に立つ」リストを入手しても、使わなければ意味がありません。

 まだやっていない人は、今度の週末にデートと同じくらい重要な作業とし
 て1時間か2時間くらいスケジューリングしておいてください。

 次回は、この続きです。
 一般的なリストとしては、あともう一つくらい紹介しようかなと思います。


2007年7月17日(火曜日)

Copying and using this list

カテゴリー: - 満蔵 @ 09時24分43秒

 「このリストをコピーして使う」ということですから、実際にやってみま
 しょう。

    On the “next page” is the list of 2,284 words. It is in
   frequency order, with one word per line. Each line contains the
   following:

    「次のページ」に2284単語のリストがあります。それは1行に1単
   語ずつ出現頻度順に並んでいます。各行は次のものを含んでいます。

    rank number-space-frequency number-space-word

    順位番号−空白−出現頻度数−空白−単語

    The frequency number represents the number of occurrences of
   that word and its related forms in the 1,000,000 words of the
   Brown corpus.

    出現頻度数は、 the Brown corpus の百万語におけるその単語と関
   連形の出現数を表しています。

    I assume that people who are reading this have some
   familiarity with computers. Here is what I would do with this
   list to make it most useful:

    私はこれを読んでいる人々が、コンピュータにある程度精通してい
   ることを想定しています。これが、私がこのリストを最も役に立つよ
   うにしたことです:

    Copy the whole list as text onto my hard disk.
    Put it into a word processor.
    Replace the spaces with tabs.
    Save the list and open it in a spreadsheet.

    リスト全体を私のハードディスクにテキストとしてコピーしてくだ
   さい。
    それをワープロで開いてください。
    スペースをタブに置き換えてください。
    リストを保存して、表計算ソフトで開いてください。

    If you do this with Microsoft Word and Excel, you’ll end up
   with a spreadsheet that has 3 columns and 2,284 rows. Now you
   can alphabetize the list, or manipulate it in any other way you
   may want.

    もしあなたがこれをマイクロソフト・ワードとエクセルで行うのなら、
   あなたは3列と2284行のスプレッドシート(表)を得て終わるで
   しょう。もうあなたはリストをアルファベット順に並べたり、あなた
   のやりたい他のやり方で操作できるのです。

    This list with its related forms can be made available. I
   also have the first 1,000 words arranged into 20 units of 50
   words each, with lots of quizzes and crossword puzzles and
   stuff. I also have a Japanese-English glossary of these 1,000
   words.

    関連形をつけたこのリストを利用できるようにすることができます。
   私はまた、最初の1000単語を、多くのクイズとクロスワードパズル、
   stuffを持った、それぞれ50単語からなる20の単位に整理したも
   のを持っています。私はまた、これらの1000単語の和英用語集を
   持っています。

 ※stuff が何のことかわかりません。憶測ですが、簡単な例話とか、単語
 を覚えるのに役に立つようなものだと思います。

 これでGSLについての話を終わりにします。

 次回、単語を覚えるという話に戻っていきます。

 さて、このGSLの和訳をはじめてからずいぶん経つので、あなたは忘れて
 いるかもしれません。

    http://jbauman.com/aboutgsl.html

 このページのお話でした。


2007年7月16日(月曜日)

About this version of the GSL - 7

カテゴリー: - 満蔵 @ 09時19分10秒

 新しいバージョンのGSLについての話の最終段落です。

    In the lemmatized Brown Corpus, while parts of speech are
   differentiated, non-semantically related homographs of the same
   part of speech are given a single, composite frequency number.
   In this list, the frequency number assigned to each headword
   include those homographic forms as well as the semantically
   linked, different parts of speech and represent all occurrences
   of that graphic word in the Brown Corpus.

    原形に直された Brown Corpus では、品詞が識別される一方で、同
   じ品詞の意味の異なる同形異義語には、個別の合成した頻度数が与え
   られます。このリストでは、それぞれのヘッドワードに与えられた頻
   度数は、意味的につながった異なる品詞と同様に、これらの同形異義
   語形を含んでいて、 Brown Corpus 内のその文字の言葉の全ての発生
   を表します。

 "the lemmatized Brown Corpus"ですが、ヘッドワードだけのリストとい
 うことだと思います。’lemmatize’は「分類整理する」というような意味
 ですが、聞いたら言語学では’lemma’は「基本形」ということらしいのです。

 それで、このリストのヘッドワードは、たとえそれが同形異義語であって
 もちゃんと区別した上で、ファミリーワードの出現頻度もちゃんと数えて
 いているということです。

 だから、「安心、正確」ということなのでしょう。

 今まで見てきて、GSLでは割りと適当だったヘッドワードの選出とファミ
 リーワードの分類を、徹底した基準で分類しなおしたことがわかります。
 そして、ヘッドワードの出現頻度数のカウントは、全てのファミリーワー
 ドの数も含んでいるように修正されました。
 結果として、この新しいGSLのヘッドワードを覚えれば、含まれているフ
 ァミリーワードもちゃんとわかるようになるよ、ということです。

 めでたし。

 さて、次回からは次の章、’Copying and using this list’をやって終わ
 りにしようと思いますが、ちらっと’Excel’ ’spreadsheet’という文字が
 見えます。

 もしかしてパソコン操作の話?
 訳せるのか、というより理解できるのか心配です。


2007年7月15日(日曜日)

About this version of the GSL - 6

カテゴリー: - 満蔵 @ 09時14分49秒

 新しいバージョンのGSLについての話の第六段落です。

    The word families include as derived forms all Bauer and
   Nation level two forms (verb inflections, plurals,
   comparatives, and superlatives). We also included as derived
   forms all qualifying Bauer and Nation levels three and four
   forms that occur in either the GSL or the Brown Corpus. Derived
   forms that do not occur in either of these sources were not
   included.

    ワードファミリーは、派生形として全ての Bauer and Nation のレ
   ベル2型(動詞の語形変化、複数形、比較級、それに最上級)を含み
   ます。私たちはまた派生形として、GSLか Brown Corpus のどちらか
   にある全ての Bauer and Nation のレベル3と4型に当てはまるもの
   を含めました。これらの情報源のどちらにもない派生形は含まれませ
   んでした。

 ワードファミリーについての話です。

 私たちに見えているのはヘッドワードだけですが、そのワードファミリー
 も、Brown Corpus まで含めてチェックしているということです。

 この丁寧さには頭が下がります。

 次回はいよいよ最終段落の予定です。


2007年7月14日(土曜日)

About this version of the GSL - 5

カテゴリー: - 満蔵 @ 09時11分09秒

 新しいバージョンのGSLについての話の第五段落です。

    The GSL was prepared for pedagogical purposes and clarity,
   therefore “no attempt has been made to be rigidly consistent in
   the method used for displaying the words” (West, 1955:viii).
   The GSL does not consistently include derived forms. By
   applying Bauer and Nations Level one to four, some of these
   inconsistencies were rectified (see below). Derived forms that
   were not included in these levels continued to reflect the
   inconsistency of the GSL. The following four affixes, -ion,
   -ition, -or and -en, caused the creation of about 100 new
   headwords. To increase consistency, derived forms using these
   affixes, were included as headwords when they appeared on the
   Brown Corpus, even if they did not appear in the GSL.

    GSLは教育学上の目的と明快さのために用意されました。そのため、
   「単語を並べるのに使われた方法が、厳格に首尾一貫しているような
   試みは全くなされていません」(ウェスト、1955年:第八章)。GSL
   は首尾一貫して派生形を含んでいません。 Bauer and Nations のレ
   ベル1から4を適用することによって、これらの矛盾のいくつかが修
   正されました(以下を参照)。これらのレベルに含まれてなかった派
   生形は、GSLの矛盾を残したままでした。次の4つの接辞、"-ion"、
   "-ition"、"-or"と"-en"は、約100の新しいヘッドワードを作る原因
   になりました。一貫性を高めるために、これらの接辞を使っている派
   生形は、たとえそれらがGSLに出ていなかったとしても、それらが
   Brown Corpus に出ていたら、ヘッドワードとして含まれました。

 突然ですが、最初の一文がよく意味がわかりません。
 要するに、元のGSLは教育学的なものでシンプルさを追求したので、言語
 学的なアプローチはしていない、というような感じに思うのですが、少し
 乱暴でしょうか。

 さて、前回までをちょっと振り返ってみましょう。

 先の段落までで、この新しいGSLを非常に正確なものにしたいと語ってい
 ました。
 そして、別途学習対象として取り上げるべき派生形の単語であっても、
 GSLはごく稀にしかヘッドワードにしていないということでした。
 そこで、ある条件をクリアすれば派生形であってもヘッドワードにしてい
 ったという話でした。

 今回はその続きでまたまた細かい話でした。

 途中、「affix:接辞」という言葉が出てきますが、具体例がないのでわ
 かりづらいです。
 ちょっと補足してみます。

 例えば、この新しいGSLには"ambition(野心)”,"ambitious(野心的な)”
 の両方が含まれています。
 元のGSLではどちらかしかヘッドワードになってなくて、どちらかはその
 ファミリーワード扱いだったのでしょう(未確認)。でもこれは確かに両
 方とも Brown Corpus にランキングされているので、ヘッドワードにした
 ということです。

 次回もまた続きの予定です。


2007年7月13日(金曜日)

About this version of the GSL - 4

カテゴリー: - 満蔵 @ 12時48分00秒

 新しいバージョンのGSLについての話の第四段落です。

    Every capitalized headword from the GSL was included. In a
   few cases the GSL listed a derived form as the headword, for
   example COMPLICATED. In these cases, the base form, i.e..
   complicate, was used as the headword. All other headwords from
   the GSL were included as headwords. GSL bold-faced derived
   forms that did not qualify for levels three or four of Bauer
   and Nation were entered as new headwords.

    GSLからの全ての大文字で書かれたヘッドワードが含まれました。
   ごく稀なのですが、GSLではある派生形が、例えば、’COMPLICATED’で
   すが、ヘッドワードとして掲載されていました。これらの場合は、基
   本形すなわち’complicate’が使われました。GSLからのほかの全ての
   ヘッドワードが、ヘッドワードとして含まれています。Bauer and
   Nation のレベル3から4に達しなかったGSLの太字の派生形は、新し
   いヘッドワードとして記載されました。

 ヘッドワードの選出基準についての話です。

 先のGSLでは、ファミリーワードとして、単語を学習する単位が問題にな
 っていました。新しいGSLでは、ヘッドワードとしてふさわしくない単語は、
 代わりにその基本形が採用され、別途勉強した方がいい派生形扱いの単語は、
 ヘッドワードに昇格させてあるということです。

 すごくしっかりしていますね。

 次回もまた続きの予定です。


2007年7月12日(木曜日)

About this version of the GSL - 3

カテゴリー: - 満蔵 @ 12時43分39秒

 新しいバージョンのGSLについての話の第三段落です。

    This list contains all of the headwords and bold-faced
   derived forms listed in the GSL, excluding hyphenated and
   compound words, grouped into word families based on levels one
   through four of Bauer and Nation (1995) and ranked according to
   frequency numbers supplied by the Brown Corpus.

    このリストはGSLに載せられたうち、ハイフンでつながれたり合成
   された単語を除いたヘッドワードと太字の派生形の全てを含んでいます。
    そして、1995年の Bauer and Nation のレベル1から4に基づい
   てワードファミリーにグループ分けされ、the Brown Corpus に供給
   された出現頻度数にしたがってランク分けされています。

 さすがに1文を分けて訳しました。

 やはり「レベル1から4」というのは詳細不明ですが、作業手順が細かく
 説明されています。

 実は、GSLのような単語リストの作成手順はなかなか明かされていないそ
 うです。
 うちの会社でもEVSのリストを作成する際に、他のリストをいろいろ調べ
 たそうなのですが、「どうしてこの単語がここに来るかなあ」というよう
 なことが多かったそうです。
 作ってみるとわかるそうなのですが、どこまで細かくやるのか、基準をど
 こに置くのかで大分結果が変わるのだそうです。

 いやあ、GSL(役に立つリスト)を作るのは大変なのですね。

 次回はまた続きの予定です。


2007年7月11日(水曜日)

About this version of the GSL - 2

カテゴリー: - 満蔵 @ 22時18分54秒

 新しいバージョンのGSLについての話の第二段落です。

    What follows may be more detail than most people need. I
   include it because I’d like to think that what we did was
   rigorous enough that someone else, using the same sources and
   the same criteria, would come up with the same list.

    次に行ったことは、ほとんどの人が必要とするより詳細かもしれま
   せん。私は、私たちがしたことは、同じ情報と同じ基準を使って同じ
   リストを提案するだろう誰か他の人より、十分に正確だと考えたいの
   で、それを取り入れます。

 非常に短いのですが今日はこれで終わりです。
 まともな(と思える)日本語にするのに非常に時間がかかりました。

 要は、不必要なくらいきちんとした作業をやったので、このリストに関し
 ては他の誰にも負けないぞ、ということですね。
 さすが、前章でグチグチと元祖GSLをけなしただけのことはあります。

 お陰で私たちは安心して活用させてもらえるわけです。

 次回はまた続きの予定です。


2007年7月10日(火曜日)

About this version of the GSL - 1

カテゴリー: - 満蔵 @ 22時14分56秒

 EVSの解説にしようかどうしようか迷いましたが、次の章に進みます。
 EVSの方は会社でレポートを用意してくれるそうなので。

 さて、次はこの新しいバージョンのGSLについての話です。
 例のごとく、第一段落から行きます。

    The list given here was created by John Bauman and Brent
   Culligan in early 1995. We wanted a version of the GSL ranked
   in frequency order. In order to address the above problems, we
   adapted two authorities. To determine which words to include as
   forms related to a headword, we used the standard set out in
   Bauer and Nation (1995). This article uses various criteria to
   group derived forms into word families. Related words are
   ranked into levels. Words related by levels 1 to 4 are grouped
   under a headword on this list, and the frequency numbers are
   added. To determine the frequency of a words, we used the
   frequency numbers from the Brown Corpus (Frances and Kucera,
   1982). Using these criteria, the GSL ends up as 2284 words.

    ここで用意されたリストは、1995年の前半に、John Bauman と
   Brent Culligan によって作られたものです。私たちは出現品語順に
   ランキングされたバージョンのGSLが欲しかったのです。私たちは上
   記の問題を処理するために、2つの出典を改変しました。私たちはど
   の単語がヘッドワードに関連した形として含まれているかを決めるた
   めに、1995年に Bauer と Nation に出された規格を使いました。こ
   の論説は、派生形の単語をファミリーワードに分類するために様々な
   基準を使っています。関連語は、レベル分けされています。レベル1
   から4に関連付けられた単語は、このリストの1つのヘッドワードに
   まとめられていて、出現頻度数がつけられています。1つの単語の頻
   度を決めるために、私たちは1982年の Frances and Kucera による
   Brown Corpus による出現頻度数を使いました。これらの基準を使うと、
   GSLは結局2284語になりました。

 お気づきの通り、やや意訳気味です。何度も見直すのが面倒なので。

 Brown Corpus は有名ですね。Bauer and Nation って誰なのか何なのかわ
 かりませんが、’The 1953 GSL’の抱えた3つの問題点を新しい2つの信頼
 性の高い情報源を使うことで解決したわけです。

 しかし、やはり元はGSLということは、最初の単語選択はどうなっている
 のだろうという気がします。

 気にしても仕方ないので、頼みます英語の偉い人。

 わからないのが、関連のレベル分けのところですが、これはどのくらいヘ
 ッドワードに関連しているとかそういうことでしょうか。あまりに違う単
 語は別なファミリーワードに分類されているということだと思います。

 affectは、’EFFECT’家から別なファミリーに養子に出されたのでしょうね。

 次回はこの続きの予定です。


2007年7月9日(月曜日)

The 1953 GSL - まとめ

カテゴリー: - 満蔵 @ 09時19分24秒

 前回までの解説を踏まえ、解説込みの意訳です。
 そう変わらないのですが、数字の計算が入っているところなど、かなり言
 葉を補足しています。

    "the General Service List"(GSL)は、1953年にウェストが作成
   した2000語の単語リストです。このGSLは、英語を学習する人にとって、
   最高に勉強の役に立つように選ばれました。単語の出現頻度は、この
   リストの単語選定の際に考慮に入れられた要素の1つです。しかし、
   GSLの2000語は最も出現頻度が高いというわけではないのです。GSLの
   2000語とは、1つのファミリーワード代表しているヘッドワードなの
   です。しかし、ウェストはそのファミリーワードをあまり厳密な基準
   で定義していません。出現頻度の数値がついていますが、これは1944年
   にソーンダイクと Lorge の情報から採っています。また出現頻度の情
   報が単語の様々な意味に対してついています。このリストは、他の資
   料と同様に、レベル別英語読本の基準として活用されながら、何年も
   の間幅広い影響を与えてきました。GSLに基づいた教科書はまだ販売さ
   れていますが、GSLそのものは絶版なのです。GSLに関するより詳しい
   情報と一般的な単語リストは、1990年のNationの21〜24ページと、
   1988年のカーターとマッカーシーの本の第1章に載っています。

    GSLは辞書のようにまとめられた中型の赤い本として出版されました。
   それぞれ2000語のヘッドワードが、簡単な定義と例文と一緒にアルファ
   ベット順に記載されています。出現頻度数を計測するための資料の単
   語数総計5百万語あたりに何回使われたかという出現頻度数を表した数
   字が、それぞれの単語についています。それぞれの意味には、その単
   語の出現回数のうち何パーセントの割合でその意味が使われたかとい
   う数値がついています。ヘッドワードは大文字の太字で記載されてい
   ます。他のファミリーワードはヘッドワードの下に小文字の太字で印
   刷されていて、普通はその単語自体の出現頻度の数値がついています。

    ヘッドワードの下のファミリーワードに含まれるものは一貫してい
   ません。もし、全てのファミリーワードがそのヘッドワードを知って
   いる英語学習者に理解できるとするなら、GSLは2000項目だと言えます。
   極端な一例を挙げると、"EFFECT"の下にはこれら「effective,
   effectively, efficient, efficiency, efficiently, and (with a
   [?]) affect」というファミリーワードが載せられています。この
   "EFFECT"は英語を学習者にとって、一まとまりののファミリーワード
   として学習できるようになっていません。GSLは一体いくつの「単語」
   を載せているのかという疑問が残ってしまいます。

    単語につけられた出現頻度数は、英語学習者にとって、単語を重要
   度順にランク分けする方法を提供します。その一方で、問題があります。
   まず、数字と単語を書き写すのはつまらない作業です。2番目の問題は、
   その単語がランク分けされる前に、ファミリーワードの出現頻度数も
   必ずヘッドワードの出現頻度数に加えられるべきかという問題です。
   もし、必ず加えられるのでなければ、どういう時に出現頻度数が加え
   られるべきなのでしょうか。3番目の懸念は、出現頻度数の元になる
   資料の年代に関係します。元々このデータはウェストによって、1938年
   と1949年に出版されました。11ページから13ページにあります。この
   データが現在の英語の実情、単語の出現頻度数などにも合っていると
   言えるでしょうか。

 要約すると、
 「GSLは英単語学習に最も役に立つリストとして公開された」
 「GSLが絶版になった今も、幅広く使われて影響力を与え続けている」
 しかし、
 「一律の出現頻度数でリスト選考したわけではない」
 「出現頻度数のカウント方法が曖昧だ」
 「元になっている資料が古い」
 ということです。

 次回は次の章に進むかどうか迷い中です。
 
 ここまで元祖GSLをけなしたのなら、そのの改善策なり何なりが示されて
 いるのが普通ですが。


2007年7月8日(日曜日)

The 1953 GSL - 解説2

カテゴリー: - 満蔵 @ 14時52分32秒

 前回、’The 1953 GSL’を理解するポイント「出現頻度」について説明しま
 した。
 今回は、もう1つのポイント、ファミリーワードについて説明しましょう。

    単語には、綴りが似ているものがたくさんあります。

      effective  効力のある
      effectively 効果的に
      efficient  効率のいい

    そして、意味も何となく似ています。
    もしかして、この単語のうちどれかを覚えれば、他の単語を覚えな
   くてもいいのではないでしょうか。

    その通りです。
    絶対とは言い切れませんが、推測はつきます。
    特に、試験の場合は書くよりも読む方が多くなりますから、細かい
   部分を覚えていなくてもどうにかなる確率が高いわけです。

    浅学にして、ファミリーワードの日本語訳にふさわしい言葉がわか
   りません。
    実際、ファミリーワードで通じるので、普通に英語学習の用語とし
   て使われています。

    ファミリーワードを眺めていると、おそらくそれは「語幹を同じく
   する言葉たち」だということが予想できます。

    仮に「同語幹語群」という訳語をあててみましょうか。
    そんな必要はないのですが、ファミリーワードのサンプルになるの
   で作ってみました。

    まず「語幹」を元に、同じ語幹という意味で「同語幹」という言葉
   を作りました。
    次に、ファミリー=仲間の言葉という意味で、「語群」をくっつけ
   て「同語幹語群」という言葉を作りました。

    こういうふうにして、「語幹」という単語を基本にして、新しい単
   語「同語幹語群」が生まれました。
    つまり、「同語幹語群」と「語幹」はファミリーワードです。

    「語幹」という言葉を知っていれば、「同語幹語群」という言葉も
   何となく理解できます。
    「多分、同じ語幹の言葉の集まりだな」というように。

    英語も同じようにして単語が作られているので、自分で単語を作る
   こともできますし、知らない単語を推測することもできます。

    つまり、ファミリーワードがしっかりと整理された単語リストがあ
   れば、1つの単語を覚えるだけで、他の同語幹の単語も理解できるよ
   うになるというわけです。

    ’The 1953 GSL’で取り上げられた EFFECT のファミリーワードは他
   に6つありますから、EFFECTを覚えるだけで7つの単語をマスターし
   たということになります。

    しかし、’The 1953 GSL’では、GSLはファミリーワードの定義が曖
   昧だというのです。

 では、次回は解説込みの’The 1953 GSL’を書くことにします。もう一つ、
 ’The 1953 GSL’には問題点が触れられていますが、特に解説は不要なので。


2007年7月7日(土曜日)

The 1953 GSL - 解説1

カテゴリー: - 満蔵 @ 14時46分46秒

 今日は解説込みで’The 1953 GSL’を基にした文章を書くことになっていま
 した。

 しかし、その前に単語の学習について知っておいた方がいい予備知識があ
 りますので、先にそれを書いておくことにしましょう。

 中級以上の方には退屈かもしれませんが、復習と思って読んでください。

    英語を学習するのに最も大切なものが、ボキャブラリーです。
    英文法やリスニング、英語の勉強にはいろいろなカテゴリがありま
   すが、全てボキャブラリーありきです。

    相手の話を完璧にリスニングできても、意味がわからなければ役に
   立ちません。
    逆に文法が全くだめでも、単語さえ知っていれば何とか片言状態で
   も言いたいことを相手に伝えることができます。

    しかし、単語を覚えるのが大事だとわかっていても、単語数はたく
   さんあります。
    時間をかければ多くの単語を習得できますが、できれば早く英語を
   使って会話や仕事に役立てたいものです。
    試験を受けなければならないなら、期限までにどうにかしなければ
   ならない事情もあるでしょう。

    そこで、覚えるべき単語を100%マスターするのではなく、よく出
   る単語を先にマスターすることでどうにかしようという発想が出てき
   ます。
    80%や90%さえマスターしてしまえば、残りは推測でどうにかなる
   のではないだろうかということです。

    そして、調べてみると単語毎に使われる回数が違うことがわかった
   のです。
    例えば、100冊の本に出てくる単語の、使われた回数を全部数えて
   みると、ある単語は1万回も使われていて、ある単語は1回しか出てこ
   ないというような分布が見られたのです。

    これが"Frequency"、出現頻度というわけですが、いろんな学者の
   先生の研究によって、まずよく出る2000語をマスターするとたいてい
   の文章の80%前後をカバーできることがわかりました。

    ’The 1953 GSL’で出現頻度が何度も強調されていたのはこのためです。
    その出現頻度の数え方が、GSLでは曖昧なのではないかというのです。

 さて、今日は出現頻度について触れましたので、次回はもう一つのポイン
 トについて触れることにしましょう。
 その後で、解説込みの’The 1953 GSL’を書くことにします。


2007年7月6日(金曜日)

The 1953 GSL - 意訳

カテゴリー: - 満蔵 @ 14時42分07秒

 今日は一度前回までの’The 1953 GSL’の和訳を意訳するのでした。

    1953年にウェストによって作られたゼネラルサービスリスト(GSL)
   は、2000語の単語リストです。英語学習者にとって、最もすばらしい
   「役に立つもの」になるように選ばれています。
    単語の出現頻度はリストへの選出の際に考慮に入れられた要素の1
   つでしたが、それらは最も出現頻度の高い2000語ではありません。
    2000語のそれぞれが1つの同語幹群を代表している見出し語です。
    しかし、その同語幹群はウェストによってあまり厳密でない基準で
   定義されたものです。
    与えられている出現頻度数は、ソーンダイクと Lorge (1944年)
   から得ています。
    また出現頻度情報は、単語の様々な意味の代わりに付与されています。
    このリストは、他の資料と同様に段階別読本の基準として役立ちな
   がら、何年もの間広範囲に渡る影響を与えてきました。
    GSLに基づく教科書はまだ販売されていますが、リストそのものは
   絶版です。
    GSLに関するより詳しい検討と、一般的な単語リストは、1990年の
   Nationの21〜24ページと、1988年のカーターとマッカーシーの第1章
   に出ています。

    発行物としては、GSLは辞書のようにまとめられた中型の赤い本です。
    2000語の見出し語がそれぞれ、簡単な定義と例文と一緒にアルファ
   ベット順に記載されています。
    (元になった資料の単語数総計)5百万語あたりの出現頻度数を表
   している1つの数字がそれぞれの単語に付与されています。
    それぞれの意味には、その単語毎に使用された意味のパーセンテー
   ジが付与されています。
    見出し語は大文字の太字で記載されています。派生形単語は見出し
   語の下に小文字の太字で印刷されていて、(通常)それら自身の出現
   頻度数が与えられています。

    見出し語の下の関連形単語に含まれるものは一貫していません。もし、
   全ての関連形単語がその見出し語を知っている英語学習者に理解でき
   るとするなら、GSLは2000項目から構成されます。
    しかし、これは明らかにそんな状態ではありません。
    極端な一例を挙げると、"効果(EFFECT)"の下にはこれら
       「effective, effectively, efficient, efficiency,
       efficiently, and (with a [?]) affect
       (効力のある、効果的に、効率のいい、能率、効率よく、
       そして(選択に疑問が残りますが)影響を及ぼす)」
   という派生形単語が載せられています。
    この"効果(EFFECT)"の記載事項は英語を学ぶ生徒にとって、一ま
   とまりの学習単位にはなっていません。
    GSLはいくつの「単語」を載せているのかという疑問が残ってしま
   います。

    単語に与えられた出現頻度数は、英語学習者にとって、単語を重要
   度順に格付けする方法を提供します。
    その一方で、問題があります。
    まず、数字と単語を書き写すのはつまらない仕事です。
    2番目は、その単語がランク分けされる前に、関連形単語の出現頻
   度数も必ず見出し語に可算されるべきかどうかという問題です。
    もし、必ず加算されるのでなければ、どういう時に出現頻度数が加
   算されるべきなのでしょうか。
    3番目の懸念は、出現頻度数の元になる資料の年代に関係があります。
    元々このデータはウェストによって、1938年と1949年に出版されま
   した。11ページから13ページにあります。
    この情報は現在の英語の状況に十分合っていると言えるでしょうか。

 結構変えたのですが、十分とは言えません。
 まだわかりづらいと思います。

 そこで、次回は解説込みで’The 1953 GSL’を基にした文章を書いてみまし
 ょう。


56 queries. 0.289 sec.
Powered by WordPress Module based on WordPress ME & WordPress

英単語マスター講座(出現頻度順) カテゴリ
英単語マスター講座(出現頻度順) カレンダー
2012年 5月
« 3月    
 12345
6789101112
13141516171819
20212223242526
2728293031  
英単語マスター講座(出現頻度順) 月別過去ログ
準会員専用メニュー
メニュー
Copyright (c) 2006 - 2008 Actbahn Co. Ltd. サイトマップ