英語学習法:1日30分90日で159の例文を覚えて英語をネイティブ並にする勉強方法 英語学習法:1日30分90日で159の例文を覚えて英語をネイティブ並にする勉強方法

2007年7月26日(木曜日)

検索エンジン・コーパスの注意点 3 〜 書き手について

カテゴリー: - 満蔵 @ 09時31分50秒

 今回は、検索結果に出てくるページを見ていくことにしましょう。

 まず、前回アメリカのドメイン(というより、誰でも使えるようになって
 いる)の中で、非ネイティブ率が低そうなドメインです。

   .gov…政府機関向け
   .mil…軍事機関向け
   .edu…教育機関向け

 もちろん、教育機関には留学生もいますし、外国から招聘された教員もい
 ますから、彼らの英語は非ネイティブなわけです。

 それでも、これらのページの英語は割合ネイティブの英語だと思って読ん
 でいいわけです。

 その他、民間だと出版社や雑誌社などは問題が少ないでしょう。

 アナウンサーやライターはいいと思います。
 インタビュー記事は、話し手によります。
 詩人の英語や、歌手の英語は、正しい英語というより芸術やエンターテイ
 ンメントの英語ですね。

 このように、ネイティブなら正しい英語の文章かといえば、もちろんそう
 ではありません。

 あなたも試してみればわかりますが、ワードなどで自分の書いた日本語の
 文章をチェックしてみてください。

 かなりチェックが入りませんでしたか?

 私は必ず訂正するように警告を受けます。

 要はネイティブでも、よほどの人でない限り正しい言葉を使っているとは
 限らないということです。

 このように見ていくと、結局書き手が誰であるか、そしてその人の英語力
 がどの程度かを個別に見ていくことが必要だということがわかります。

 言葉というものは変化していくものですが、英語は私たちのような非ネイ
 ティブも多用しますので、より変化が起こりやすい言語なのかもしれませ
 ん。

 そして、ネット上で非ネイティブがこぞって今までとは違うフレーズを使
 い始めると、それがスタンダードになる可能性もあります。

 検索エンジンをコーパスとして考えた場合、その変化を一番早く反映し
 たデータベースであるということができます。

 次回はまた、「あなたに必要な単語数」の話に戻ります。


2007年7月25日(水曜日)

検索エンジン・コーパスの注意点 2 〜 ドメインについて

カテゴリー: - 満蔵 @ 09時27分40秒

 ドメイン(domain)とは、「インターネット上にあるコンピュータを指す
 識別子」です。
 わかりやすく言うと、インターネット上の「住所」です。

 今回注目してほしいのは、一番右側の”.com"”.uk"の部分です。

 これは、アメリカ以外は、国を表します。

 .ac Ascension Island アセンション島(英)
 .cn China 中国
 .gb United Kingdom of Great Britain and Northern Ireland イギリス
 .jp Japan 日本
 .nz New Zealand ニュージーランド
 .ru Russian Federation ロシア連邦
 .uk United Kingdom イギリス ※.gbよりも使われている

 ※出典: フリー百科事典『ウィキペディア(Wikipedia)』

 アメリカは.comや.net、.orgのように国の識別がありません。

 これは、元々インターネットのドメインがアメリカで始まったもので、世
 界中で使う、つまり国別に識別する必要があるという意識がなかったから
 ではないかと思います。

 そのため、.comなどはアメリカばかりではなく、世界中の企業や個人が使
 う習慣があったので、特にドメインの所有者の国籍に制限はありません。

 これがどういうことかといえば、検索エンジンで英語のフレーズを検索す
 る際、アメリカつまり.comや.orgを選択しても、日本や中国やロシア国籍
 の企業、個人が作ったサイトが混じっているということです。

 その点、他の国籍別ドメインはある程度制限がありますので、.comほど非
 英語ネイティブが混じっている可能性は少ないです。

 次回は、書き手が誰であるか、ネイティブの英語について説明します。


2007年7月24日(火曜日)

検索エンジン・コーパスの注意点 1 〜 検索エンジンについて

カテゴリー: - 満蔵 @ 09時14分38秒

 前回は Google を例にとって、コーパス的な使い方を説明しました。

 今日はその注意点ですが、まずは検索エンジンそのものについて考えてみ
 ましょう。

 検索エンジンの代表格は、GoogleやYahoo!、MSNといったところですが、
 それぞれの検索エンジンの検索結果、成り立ちや運営方針は異なります。

 例えば、Googleはプログラムによって、ネット上のサイトの情報を収集し、
 インデックスする方法で検索エンジンの雄となりました。

 逆にYahoo!は、検索エンジンとしては後発で、人によるサイトの登録をメ
 インとしたディレクトリを中心にしてきました。

 そう考えると、Googleは純粋にネット上に存在する情報を収集していますが、
 Yahoo!は自社のディレクトリを中心に情報収集しているとも考えられます。

 しかし、Googleのプログラムは類似した情報をカットしたり(なぜなら、
 他人のサイトを違法にコピーしたサイトを作る人が存在するからです)、
 過剰なSEO対策(検索エンジンの検索結果で上位に表示されるようにする
 対策)を施したサイトをインデックスから削除したりする機能を持ってい
 ると言われます。

 要するに、どの検索エンジンもネット上の情報を完全に反映しているとい
 うわけではないのです。

 次回は、.comや.ukといったドメインについて説明します。


2007年7月22日(日曜日)

EVS順位9136の英単語、corpus とは?

カテゴリー: - 満蔵 @ 09時10分52秒

 今まで、GSLでは the Brown Corpus、AWLでは the Academic Corpus とい
 う名前が出てきましたが、一体何なのでしょう。
 
 corpus とは、「a collection of written or spoken texts[ox]」、つまり、
 「書かれたあるいは話された文章を集めたもの」です。

 具体的には、文学全集だったり、ネッシーに関する研究資料大全だったり、
 何でもいいのですがかなり多くの文書を集めたものということです。

 こういう英単語リストに関する corpus の場合は、コンピュータに蓄積さ
 れている電子化された言語データのことです。

 もちろん、英語だけではなくて日本語や他の国の言語のコーパスも存在し
 ます。

 その元になるデータは、本や雑誌、インタビューなど、コーパス作成者の
 意図した範囲でいろいろなものが集められています。

 元々コンピュータで作成された文章はいいのでしょうが、紙に書かれた文
 字やオーディオメディアに録音された音声の場合、電子化するのがとても
 大変そうです。

 ビジネスコンビニなんかで、資料の電子化などを頼むと、「ええっ」とい
 う金額を取られます。

 また、それらの文章には著作権がありますから、取り扱い要注意です。コ
 ーパスはコンピュータでいろいろな検索ができますから、日常でほとんど
 使わないような有名な映画のセリフが検索結果として出てきたら、問題に
 なりそうです。

 そのあたりは大学や大きな出版社が取り組んでいることなので、クリアさ
 れているのでしょう。そういうわけで、コーパスは巨大なブラックボック
 スだったりしそうです。

 ※著作権に関する記述は推測ですので、一切内容を保証しません。

 コーパスのいくつかを、EVSのレポートで紹介する予定ですが、まん単で
 はもっとも手軽に利用できるコーパスをご紹介することにしましょう。

 次回はブラウザを立ち上げてお待ちください。


24 queries. 0.026 sec.
Powered by WordPress Module based on WordPress ME & WordPress

英単語マスター講座(出現頻度順) カテゴリ
英単語マスター講座(出現頻度順) カレンダー
2012年 5月
« 3月    
 12345
6789101112
13141516171819
20212223242526
2728293031  
英単語マスター講座(出現頻度順) 月別過去ログ
準会員専用メニュー
メニュー
Copyright (c) 2006 - 2008 Actbahn Co. Ltd. サイトマップ