さかなBBSトップ
魚のことならおまかせ。WEBさかな図鑑
釣具の通販・Gear-Lab
HOME 似たもの検索  携帯版  | Gear-Lab

新コミュニティ(掲示板)オープンのお知らせ

WEB魚図鑑では、2013/7/25より新しいコミュニティをオープンしました。 「このお魚何?」というQ&A専用のページもあります。是非新しいコミュニティを使ってみてください。新コミュへの投稿はズカンドットコムへのアカウント登録が必要です。2013年1月以前にWEB魚図鑑へ投稿したことのある方はアカウントの引き継ぎを行うことができます。


[▲前のスレッド]

[4259] マトリックス法>これ面白いんちゃうん? 
2003/1/6 (月) 07:00:18 小西英人HomePage
 去年の10月に『公開講演会:生物多様性研究・教育を支える広域データベース』というのが法政大学で開かれていました。

 それの報告が下記のURLで公開されています。

http://protist.i.hosei.ac.jp/GBIF/20021014/index.html

 いま、生物多様性条約の流れの中で、国際的に、生物画像データベースを共有していこうではないかという気運が高まっており、日本も遅れてはならじと進めています。その流れの中の公開講演会です。

 魚類では知ってはる人も多いと思いますが【私的ハゼの百科事典】を主宰してはる、東京大学海洋研究所の向井貴彦博士が講演されています。

 この中で、いろいろな生物データベースが紹介されていますが、【日本産アリ類画像データベース】の紹介の中で、面白い検索法があったので紹介してみましょう。

 マトリックス法という検索法です。

http://protist.i.hosei.ac.jp/GBIF/20021014/abstracts/Imai/sec_5c2.html

 これ、よく分からないのだけど、ここの【WEBさかな図鑑】の、新しい検索法として、みんなで研究してみたらどうだろう? とちょっと興味があります。

 しかし、よく分からないので、ここで小石だけ投げておくね。

 興味のある人は、データベース検索のマトリックス法というのを見に行ってね。それから、パソコン音痴、データベース音痴のぼくに、いろいろ教えてくれない?

                         英人

[4266] RE: マトリックス法>面白そう 
2003/1/6 (月) 21:36:43 じゅん坊
 ども、英人さん。

 マトリックス法が、どんなもんかは各URLを参照してみて分かりました。特に目新しい方法ではなくて、言語データベースや物質分析関係では昔から使われてる方法です。【日本産アリ類画像データベース】なんかは2次元マトリックスを使っているようですが、言語データベースなんかでは、3次元以上のn次元マトリックス法を使っています。まあ、ビジネスベースで動いている僕なんかは、携わった事は無いんですけどね。

 さて、「さかな図鑑」での事ですが、2次元マトリックス程度なら現在のスペックで十分対応できますよ。n次元なんかだと、環境的に無理だけどね。マトリックス法の最大の利点はって言うと、ファジーな検索が出来るって事ですよね。現在の「さかな図鑑」の検索方法だと、キーワードがヒットしないと検索できません。ところが、マトリックス法なら、曖昧な条件でも検索できます。

 具体的に言うと、体型(シルエット)は**で、鰭の形はxxって風に指定すると、近いものから順に検索結果が表示されます。最後は人間の判断なんだけどね。これだと、素人でも一定の同定作業が出来ます。上手く作れば、携帯電話版なんかも十分作れるんで、釣り場で同定なんてのも夢じゃないよね。

 作業的には、同定に必要な項目を挙げる事から始まります。必要な項目を挙げて、同定に重要な順に負荷を付けます。体型は50点で、鰭は25点、色は10点って風にね。これでヒット項目を加算して、点数の多い順に検索結果を並べるって事になるんだな。

 ねっ、面白そうでしょ? Web版釣魚検索なんて感じになるでしょ?


 魚種の同定に必要な項目を募集してもイイ。それをまとめて、僕がシステム化すればイイんだもんね。

 時間の掛かる作業ですから、今から募集しましょうよ。取り敢えず、同定に必要な項目を重要な順に並べて、このスレッドに投稿して下さい。集まったら、整理して負荷をどれくらいつけるかを議論すればイイじゃん。

[4269] Re2: マトリックス法>面白そう 
2003/1/6 (月) 23:56:32 小西英人HomePage
▼ じゅん坊さん

 ありがとうございます。

 なんとなく、面白そうだと思っていたのですが、なんとなく、よく分からなかったのです。ちょっと見えてきました。

 とにかく、どこでみるか項目をだして、それぞれの項目の中で「重みづけ」をした数値化して、それを加算して並べると「似たモン」順になるということですね。

 もうちょっと考えてみます。          英人

[4284] マトリックス法>いろいろ質問です 
2003/1/7 (火) 13:39:34 小西英人HomePage
▼ じゅん坊さん

 質問だけど。

 「重みづけ」なんだけど、これは、たとえば

●体色
●体形
●横帯

 という項目があったとして、この項目の横軸にすべての登録されている種がはいることになりますよね。これは、登録されている種の親データに、それぞれ項目のキーを埋め込むことになると思うのです。

 たとえばマダイなら、●体色は赤い ●体形はタイ型 ●横帯はなし というようになるのでyそうが、このときに数値化するのは、項目に固有の数値にするのですか、それとも、種によって数値を変える、つまり「重みづけ」をかえるというのは可能なのでしょうか。

 たとえば、イシダイなら●横帯 のところで7本を選べば、これはほとんど間違いないので、平均は10点だけど、100点にしておくなんてこと可能なのでしょうか、こういう形で「重みづけ」ができるのなら、かなりヒット率が高くなると思うのです。

 もうひとつ。

 上の考え方なら、親データが基本になると思うのですが、たとえば、親子や、雌雄で、まったく違う形態の種の場合、この親データをふたつにわけて、親子とか、雌雄の、ふたつのキーを埋め込むことは可能なのでしょうか?

 それと、ふつうには、体色や体形、鰭や斑紋などが、項目にあがるのでしょうが、たとえば分布(南日本とか)、生息域(砂とか磯とか)、大きさ(10cm未満、50cmまで、8cmまで、1m以上)などという項目も、ヒット率を上げるために有効になると思われます。

 みなさんで、こいういう項目があったらいいなと思われるもの、書いてみてくださいね。

 しかし、まったくの素人が考えているから、どこまであっているのか、まったく検討がつかんなあ。

 間違えていたりして…。             英人

[4293] Re:マトリックス法>いろいろ質問です 
2003/1/7 (火) 21:36:04 じゅん坊
個々の負荷付けはこれから先の話なんですが、まあ一般的な方法を記してみますね。

まず、各項目の順位付けをします。そして、順位が上のものに大きな負荷を架けるんですね。同順位のものには、同じ負荷をかけます。例えば、以下の順序にしたとします。

体形>体色>横帯>分布=生息域

この場合、体形には1000単位、体色には100単位、横帯には10単位、分布と生息域には1単位って負荷を付けます。これを元にして数値化していきます。

体形=鯛型=2=2×1000=2000
体色=赤=5=5×100=500
横帯=1本当り10
分布=北日本=3
生息域=砂底=2

こんな具合でしょうかね。例えば、鯛型に分類できるけど、少し違うんならデータ上の体形は、1.8なんてすると体形の数値は1800になるでしょ。まあ、この負荷のかけかたが難しいんですけどね。

>  上の考え方なら、親データが基本になると思うのですが、たとえば、親子や、雌雄で、まったく違う形態の種の場合、この親データをふたつにわけて、親子とか、雌雄の、ふたつのキーを埋め込むことは可能なのでしょうか?

 これは、データの持ち方の問題なんで、どうにでもなります。現在の親データをそれぞれで分けてもイイし、1つの親データに雌用、雄用なんてのを分けて付けてもイイ。

[4296] Re2:マトリックス法>いろいろ質問です 
2003/1/7 (火) 22:29:11 小西英人HomePage
▼ じゅん坊さん

 基本的には項目に対して重みをつけるのは分かりました。

> 体形=鯛型=2=2×1000=2000
> 体色=赤=5=5×100=500
> 横帯=1本当り10
> 分布=北日本=3
> 生息域=砂底=2


 という例でみると、鯛型=2=2×1000=2000 というところの「2」という数字が、項目ではなく、その種に対する数値になるから、それぞれの種に対しては、この数値で「重みづけ」をしておいたらいいのかな?

 まったく、なにも見えていなくて、勘だけで、ぼく、なんかしゃべっていますが、そう遠いところを言っているわけではないようですね。ちょっと安心。

                          英人

[4298] Re3:マトリックス法>いろいろ質問です 
2003/1/7 (火) 23:27:29 じゅん坊
>鯛型=2

 なんですけど、2自体に意味はありません。データベース上のデータとして、体形=鯛型ってデータ化する訳にはいかないんで、鯛型は2と表記してるだけです。別に1でも9で構わないんですよ。

 要するに、鯛型のデータ上表記は2ですってだけです。

[4299] Re4:マトリックス法>いろいろ質問です 
2003/1/7 (火) 23:43:39 小西英人HomePage
▼ じゅん坊さん

 分かりました。勘違いしました。

 最初に紹介した、マトリックス法を紹介している、【日本産アリ類カラー画像データベース】のなかのマトリックス法紹介のなかで、各種ごとに形質の「重みづけ」を変化させられると書いています。その部分だけ、引用させてもらいますね。

注:同じ形質でも,種によってはそれが重要な分類マーカーになる場合とそうでない場合があります。マトリックス検索では形質マトリックスを部分的に変更する(形質を重複して記載する)ことで,形質ごとの重みづけを変えることができるだけでなく,各種ごとに個々の形質の重みづけを変化させることもできます。これにより,特定の形質を選んだ場合,それを特徴とする種を他に優先して選び出すことができます。

 上記のようなことをするのに、実際には、どのようにするのかなと、疑問に思っているのです。

                            英人

[4302] Re5:マトリックス法>いろいろ質問です 
2003/1/8 (水) 00:04:36 じゅん坊
 そんなに難しい事ではないですよ。

 例えば、体形は、一番細いの(例えばアナゴとか、ウミヘビ)を1として、太くなるに従って数字を大きくすると規定します。ただ、体形だけで**であるって決められるようなものがあれば、それは順序を無視して細くても、200と指定すれば良いのでしょうね。

 ただ、アリと魚、分類方法も違いますから、これらの方法は、順次煮詰めて行くしかないでしょうね。紹介された文章等を読むと、これといった手法が確立されている訳ではないようなので、あまりアリ類データベースの方法に囚われる必要は無いように思います。
 こっちはこっちで独自路線で行きましょうよ。

[4304] マトリックス法>どんな項目で検索したい? 
2003/1/8 (水) 06:13:01 小西英人HomePage
▼ じゅん坊さん

 わかりました。

 そういう種による「重みづけ」ができるというのが分かれば、ぼくはいいのです。

 アリの方も、いまのところはうまくはいっていないようで、これは、たぶん、分類群によって、まったく違うし、かなりの試行錯誤を要求されるし、難しいでしょう。たぶん、同じ魚でやっても、やる人の考え方によって、まったく違う物になり、ヒット率も劇的に違うのではないかという気がします。そのぶん、スマートに考えれば、かなりのものができそうですから、面白そうですよね。

 どんな検索項目がいいのか、どう重みをつけたらいいか、つらつら考えてみます。そのときに、種による重みづけができるかできないかで、かなり変わるだろうと思ったので、聞いてみたのです。

 しかし。

 ぼくは、なんとなく、ぐだぐだいっているけど、だいたい、CGIなんてのも、まったく知らないし、ほんと、分かっていません。素人のくせにむちゃくちゃいっています。それも、まあ、おもろいね。ブレーンストーミングなんて、門外漢をひとりいれるのが、成功の秘訣だもんね。

                        英人
ps
 項目は多い方がいいのだろうか、少ない方がいいのだろうか。これはユーザーインターフェースにも関わってくるけど、みなさん、どう。

 知らない魚を見たら、どこから気になるか、色か、斑紋か、体形か、その順番でも、みなさん、書いてくれたら助かるなあ。

pps
 違う分類群って、そのままは使えないんだけど、非常に参考になります。たとえば、アリので言えば、大きさによる検索に感心しました。アバウトに並べていくときに、大きさによるって、ひとつのアイデアだと思うのです。

 たとえば、メーターオーバーが選ばれると、実際に釣魚としては、かなり絞られてしまいます。

 しかし、これを、どれくらい刻みにするか、項目にどれくらいの評価をするか、種によってどれくらいの評価をするか、いろいろ考えなければなりません。


[4324] 知らない魚を見たら 
2003/1/8 (水) 19:26:38 KOUJI
▼ 小西英人さん

 色、体型、模様の順かな。
 知ってる魚だとしても、釣り上げる時は大体色から目に入ってくるし。

[4327] Re:知らない魚を見たら 
2003/1/8 (水) 21:48:56 小西英人HomePage
▼ KOUJIさん

>  色、体型、模様の順かな。

 たしかに、まず色ですね。            英人

[4267] Re:マトリックス法>これ面白いんちゃうん? 
2003/1/6 (月) 22:37:42 KOUJI
◆画像拡大
▼ 小西英人さん

 マトリックスってのはこう言うもんですよね?

 ここの図鑑検索、前から思ってたんだけど、科とか和名とか判ってる人や、判る魚は良いとして、判らない人や魚には使えないですよね。
 50音サムネイルがあるのは救いだけど、紙の図鑑と同じで、片端から見ないと駄目だし。
 これ結構しんどいです。

 だから、例えば「赤い」で検索すると、赤い魚がそれぞれの大きな特徴付きで出て来るだけでも随分楽だなとか思います。

[4270] Re2:マトリックス法>これ面白いんちゃうん? 
2003/1/7 (火) 00:18:12 小西英人HomePage
▼ KOUJIさん

 マトリックス法って、KOUJIさんの表とは、ちょっと違うと思います。

 ぼく、まったく分かっていないから、間違っているかもしれないけど、間違ったら、誰か正してね。

 たぶん、KOUJIさんのつくったような表を、すべての種でつくるのですが、そこからが、ちょっと違って、その表にある項目、まあ魚の形質ですね。これを順番に選んでいくと、それぞれの形質での数値が選ばれて加算されて、その数値が多い順に並べかえることだと思っています。

 これは、うまくやると、似たモン順になるのではないでしょうか?

 たとえば下のように●3項目について○の選択肢があったとします。

 ●体型 ○タイ型 ○ウナギ型 ○フグ型
 ●体色 ○赤色 ○橙色 ○黄色
 ●尾鰭の形 ○円形 ○湾入形 ○二叉形

 KOUJIさんの書いた例で言うと、たとえばマダイ知らなくて。それをを検索しようとして「タイ型」「赤い」「湾入形」を選んでand検索すると絞りこまれ、ヒット率が高くなりますが、生物は、それほど単純ではなく変異があり、幅があります。体色が橙色に見えた場合、and検索をすると、その体色という1項目の「ぶれ」だけで、マダイは消えてしまいます。どこかひとつ違う選択するだけで、まったく消えてしまうのです。これを防ぐために、or検索すると、こんどは、どんどん増えていきますので、だんだん分からなくなる恐れがあります。

 マトリックス法とは、すべての種に、この表をつくっておき、たとえば体型が重要なら10点、体色なら8点、尾鰭の形なら5点、というようにしておいて、検索で選択されたら、その点数を加算して、その点の多い順に並び替えすることだと、ぼくは思っています。この方法なら、たとえばマダイで「黄色」を選んだとしても消えることはないし、かなり上位にのこるであろうと思われます。いや、少々、いい加減に選んでも、上に来るように、うまく形質を絞り出して、うまく重みづけをしてやると、簡単な検索で、かなり効率的な「似たモンリスト」が勝手にできあがらないかと思うのです。

 これは、なれていない人でも、かなりヒットの率の高い検索方法になる可能性があると思います。

 そんなイメージだけど、どうなのかな?    英人

[4297] Re2:マトリックス法>これ面白いんちゃうん? 
2003/1/7 (火) 22:33:05 小西英人HomePage
▼ KOUJIさん

 KOUJIさんのつくりはった「表」も、これ、面白いですね。

 いろいろ考えていたのですが、科まで絞りこんだ場合、科から、それぞれの種に絞るときの検索表としては、ちょっと分かりやすいかなと思います。こんなのも、また、別に創ってもいいかなとも思いますが、ボラ科だからできるのであって、ベラ科とか、ハタ科とかになると、お手上げかなとも思いますね。

                            英人
ps
 けど、うまいこと、つくるなあ。KOUJIさんは。

[4300] Re3:マトリックス法>これ面白いんちゃうん? 
2003/1/7 (火) 23:44:55 KOUJI
▼ 小西英人さん

 これはマトリックス法でなくて、マトリックス表でしたね。
 法の方はわたしにはまだよく分かりません。

 この表は見ての通り、釣魚検索のフローチャートを表にしたものですが、仰せの通り種が多いと凄い事に成ります。
 だからボラ科で作ったんですが・・・

 表よりも面倒な感じになるけど、表にしなくても、キーのテキストや画像とかと一緒にチェックボックスとかラジオボタンとか設けてずらっと並べておいて、当てはまる物はチェックを入れて検索ボタンを押すと表示と言う風にも出来ます。
 これなら縦に長くなっても横には長くならない。
 まあテキストがずらっと並んでるのも、人によったらウワッと思うかも?ですがね。

[4301] Re4:マトリックス法>これ面白いんちゃうん? 
2003/1/7 (火) 23:57:16 小西英人HomePage
▼ KOUJIさん

 マトリックス法の分かりやすい説明は、アリのデータベースの中で説明してはります。

http://ant.edb.miyakyo-u.ac.jp/HTMLS/WMATRIX.HTM

 を読んでみてください。                 英人

[4303] Re4:マトリックス法>これ面白いんちゃうん? 
2003/1/8 (水) 01:18:07 渡辺謙司
▼ KOUJIさん

マトリックス表で、うわっと言うのも、いろんな使い方ができて面白そうですね。

同じ魚を見ても、十人十色の表現の仕方があると思います。
思ったままにチェエックしていって、現れた魚と実際の魚とを比較すると楽しそうです。



[4328] RE: マトリックス法>別の方法 
2003/1/8 (水) 22:43:05 じゅん坊
 マトリックス法で、ちょっと目先を変えたのを思い付きました。アリの方は、各ポイントを加算して行くようですが、近似値を算出するって方法ね。特殊な例を考えるのはヤメにしてます。あくまで、一般形式を固めるのが先ですからね。

例で説明してみます

○データベース上データ
−−−−−−−−−−−−−−−−−−−−−−−−
魚名   | 体型  |  色  | 体側線 |
−−−−−−−−−−−−−−−−−−−−−−−−
A魚   | 2.3 | 3.5 |  2  |
−−−−−−−−−−−−−−−−−−−−−−−−
B魚   | 3.4 | 4.2 |  3  |
−−−−−−−−−−−−−−−−−−−−−−−−
C魚   | 1.5 | 8.2 |  2  |
−−−−−−−−−−−−−−−−−−−−−−−−
D魚   | 2.0 | 4.5 |  1  |
−−−−−−−−−−−−−−−−−−−−−−−−


○検索条件
−−−−−−−−−−−−−−−−−−−
| 体型  |  色  | 体側線 |
−−−−−−−−−−−−−−−−−−−
|  3  |  5  |  4  |
−−−−−−−−−−−−−−−−−−−


検索条件と、データベース上データの差を求めて、合計を出します
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
魚名   | 体型  |  色  | 体側線 | 合計
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
A魚   | 0.7 | 1.5 |  2  | 4.2
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
B魚   | 0.4 | 0.8 |  1  | 2.2
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
C魚   | 1.5 | 3.2 |  2  | 6.7
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
D魚   | 1.0 | 0.5 |  3  | 4.5
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

合計の小さいほうが検索条件に近いって事ですから、検索結果は

B魚、A魚、D魚、C魚って順に表示される事になります。こんなのどうです?

[4329] Re2: マトリックス法>別の方法 
2003/1/9 (木) 06:27:57 小西英人HomePage
▼ じゅん坊さん

 これは、どういうメリットがあるのですか?

 加算法で、極端な数値がでてしまわないようにして、どちらかといえば標準に対してどれほどずれるかという「簡易な偏差値法」のようなものとイメージしていいのでしょうか?

 このほうが、ノーマルに数字を扱える可能性がありますね。

 また、特殊な例の時は、種のデータをマイナスの数値にするということで対処できますね。

 こんなイメージで合っていますか?

                          英人

[4330] Re3: マトリックス法>別の方法 
2003/1/9 (木) 08:02:10 じゅん坊
 ども、英人さん。

>標準に対してどれほどずれるかという「簡易な偏差値法」のようなものとイメージしていいのでしょうか?

 まさにそうです。考えたとしては、標準偏差を念頭に置いたんですけどね。これだと、データベース上の各項目の設定ルールが比較的簡単に出来ると思うし、数字の取り扱いが簡単ってメリットありますよね。近い種同士で、極端な数値差は出難いだろうし。

[4331] Re4: マトリックス法>別の方法 
2003/1/9 (木) 08:18:17 小西英人HomePage
▼ じゅん坊さん

 よかった、イメージが合ってて。

 なんせ、ぼくは数学音痴ですからね。「文化頭」ですから。文科じゃないよ。ザンバラ頭を叩いてみれば「文明開化」の音がするの「文化」だから、困っちゃう。

 かなり、きれいになると思うけど、そのぶん、「標準」を設定するのが大変だね。それと、実際には、項目の中をどれくらい分けるかとか、いろいろあるよね。

 けど、細かいことは走りながらでも決められるし、基本を一本引いておかなければいけません。

 ぼくは、じゅん坊さんの方法、勘でしかいえませんけど、巧妙な方法になると思います。あとあと、数値を修正するにしても、「標準」に向かって、幅を設定するだけの作業になるのですから、加算法みたいに青天井にはならないもんね。

 ひょっとすると、その魚の「標準」の数値って、けっこうおもしろいことを表す数値になるのかもしれないな。数字が落ち着いたときにはね。

 ぼくみたいに極端な奴は、なにをやるかわからない。じゅん坊さんみたいな、冷静で数学頭の設計屋は、それを抑えて、ノーマルにやれるシステムを考えるんだろうなあ。

 やっぱり「あほ」が混じる方がいいんだ。ブレーンストーミングは。

                            英人

[4340] Re5: マトリックス法>別の方法 
2003/1/9 (木) 21:54:39 じゅん坊
▼ 英人さん

>  やっぱり「あほ」が混じる方がいいんだ。ブレーンストーミングは。

 そうなのよね。色々な人が、色々と言ってくれたほうが思いもしない案が出てくれて有効なんですよね。素人って言えば僕もそうですよ。魚の分類なんて殆ど判らない。ユッケ君の方が、よっぽど詳しいと思うんだな。

 加算法なんだけど、深く考えたわけじゃないんだけど、負荷の掛け方がかなり難しいと思えるんですよ。優先順位が高い項目に高い負荷を付けるんだろうけど、加算してるうちに、それが数値の中に埋もれてしまう可能性があると思うですよね。

 標準偏差だと、似たものを集めるって事になります。同じ種ってやっぱり姿形が似るんだろうから、標準偏差の方がイイと思うんだけどな。

[4341] Re6: マトリックス法>別の方法 
2003/1/9 (木) 22:31:20 あらら
▼ じゅん坊さん
▼ 英人さん


どうしても参加したい気になって、読んでたんですが、なんとなくイメージが沸いてきました。ファジーをデジタル化する方法論なんですね?(ちゃうかな?)

これが実現できたら、さかな図鑑は素人でもかなり有効に利用できることになりますね。今、参加されてる方の多くは、複数の書物を持ってらして自分である程度解決できるように思いますので、このままの姿でも充分だと思うし、判んない場合は強力なサポーターの方々によって即解決できる状態だと思うのですが、実は投稿したくてもできない相当のユーザーが後ろにあるような気がしてます。そんな方々にもすんなり入って来られる環境ならなお更、お魚も集まるでしょうね。

じゅん坊さん!これシステム化できるんですか?すごいなぁ
問題は魚の条件に対する数値設定は作業ボリュームがありそうですね。(基礎データの作成)
これはここで論議することかな?

意見として、項目に「釣り場」っていうのがあれば、魚も最初から限定されると思います。(沖・磯・波止・河口・川 etc)
検索も2窓あれば良いと思います。(初心者向け・上級者向け)

すみません。実ははっきり判ってませんし、見当違いのこと書いてるかもしれません。(-"-)



[4343] Re7: マトリックス法>別の方法 
2003/1/9 (木) 23:39:49 小西英人HomePage
▼ あららさん

 ありがと。

 何でも書いてね。ほんとうにいま、ぼくも五里霧中だからね。

 ほんと、数値の設定はすごいボリュームになるでしょうし、けっこうメンテナンス、というより、修正をしていかなければいけないのではないかと、ちょっと恐れています。その作業は、ぼくだもんな。

 項目に、釣り場は入れます。ただし、表記は釣り場ではなくて、ハビタットにしようと思います、生息地ですね。

 砂or泥、磯、ごろ石

 それに、

 沖合、沿岸、河口、川、渓流

 と2項目にしなければならないのかな。

 初級と上級というのは、考えていなかったけど、いいかもしれませんね。

                         英人

[4342] Re6: マトリックス法>別の方法 
2003/1/9 (木) 23:31:50 小西英人HomePage
▼ じゅん坊さん

 標準偏差、いけそうに思うのだけど、たとえば、項目の中を割っていって、それぞれ数値化するとき、なんか、落とし穴がありそうな気がします。それは、たとえば形で言うなら、すべての体形が出せた場合、標準偏差がいいのでしょうが、これはうっとおしくなるのと、意味を持たなくなる恐れがあります。

 たとえば鯛型というと、ベラなども、鯛型になるでしょう。大きく言うと、鯛型とフグ型とウナギ型と紡錘型と円盤形とコチ型とカレイ型くらいになります。この場合、マダイも、キュウセンも、イサキも、スズキも、鯛型になります。そこで標準偏差をとったときに、実際に、近似種に収束してくれるかどうか疑問があります。これを防ぐために、型を増やすと、検索が煩雑になるのと、鯛型、スズキ型、ベラ型、ハゼ型、などと延々と続くと、曖昧検索の意味がなくなってしまいます。なんか、知っている者が知らない者を言葉で誘導尋問するようなシステムにならないかと危惧するのです。

 この辺は、ちょっと、プロトタイプをつくって、実際に数字を割り振ってみた方がいいようですね。

 ちょっとプロトタイプ、いろいろなことで迷っています。たとえば、魚類学的なきれいさをは基本として通すか、分かりやすいように、くだいてしまうかというようなことも難しいです。もうちょっと、ゆっくり考えてみます。

 それと、たとえば、魚類全般を相手に、あいまい検索をするのだったら、やはり無理があって、初めに、2分岐で落とすか、最初からスタートを分けるかというようなこともあります。具体的に言うと、円口類、サメ・エイ類を含めての、曖昧検索は難しいし、分岐で落とすか、はじめからオミットして硬骨魚類だけに逃げちゃうかというようなことです。

 まあ、もうちょっと考えてみます。

                           英人

[4344] 偏差法>ちょっとした雛型です 
2003/1/10 (金) 15:09:46 小西英人HomePage
▼ じゅん坊さん
▼みなさん

 ちょっと「マトリックスじゅん坊偏差法」の、ほんの雛型をつくってみました。
これはプロトタイプというような物ではなく、考え方の説明と、ちょっとした数
値の動きを見るためです。

 話を簡単にするために次の3形質に絞りました。横の数字は、標準評価です。
この数字との差が少ないほど、似ています。また標準評価の数値が大きいほど
「重み」があります。それぞれ、かんたんに中をわけてみて、6種ほど選び、
それぞれの数値を入れておきました。これが、いわゆるマトリックスですね。
空白は列が崩れるので、・をいれておきました。

 ■体形10
 ■体色8
 ■斑紋6

==========================================================
■体形=標準評価10
a◎側扁型(横に平たい形・マダイ・スズキ・キュウセンなど)
b◎縦扁型(縦に平たい形・マゴチ・ネズッポ類など)
c◎紡錘型(円筒形で両端がくびれた形・カツオ・マグロ類など)
d◎異体型(横倒しになって平たい形・カレイ類・ヒラメなど)
e◎円筒型(筒のような形・ハゼ類・トラギス類など)
f◎長い円筒型(長い筒形・ウナギ・ウミヘビ類など)
g◎長い側扁型(長く横に平たい形・タチウオ・ダツ類など)
h◎球型(フグ類)
==========================================================
・・・・・側扁・縦扁・紡錘・異体・円筒・長円筒・長側扁・球
マダイ・・・10・・0・・0・・0・・0・・・0・・・0・0
マハゼ・・・0・・0・・0・・0・・10・・・0・・・0・0
キュウセン・10・・0・・0・・0・・0・・・0・・・0・0
ネズッポ・・0・・10・・0・・0・・0・・・0・・・0・0
クサフグ・・0・・0・・0・・0・・0・・・0・・・0・10
クロダイ・・10・・0・・0・・0・・0・・・0・・・0・0
==========================================================
==========================================================
■体色=標準評価8
a◎青っぽい
b◎緑っぽい
c◎茶色っぽい
d◎赤っぽい
e◎黄色っぽい
f◎銀色っぽい
g◎黒っぽい
h◎背が青黒い
==========================================================
・・・・・青・・緑・・茶・・赤・・黄・・銀・・黒・背青黒
マダイ・・0・・0・・0・・8・・0・・0・・0・・0
マハゼ・・0・・0・・8・・0・・0・・0・・0・・0
キュウセン6・・5・・1・・6・・2・・0・・0・・0
ネズッポ・0・・0・・8・・0・・0・・0・・0・・0
クサフグ・6・・6・・0・・0・・0・・0・・0・・6
クロダイ・0・・0・・2・・0・・0・・4・・8・・3
==========================================================
==========================================================
■斑紋=標準評価6
a◎横帯がある
b◎縦帯がある
c◎斜走帯がある
d◎暗色円斑がある
e◎白色円斑がある
f◎模様はない
==========================================================
・・・・・横帯・縦帯・斜走帯・暗色円斑・白色円斑・無斑
マダイ・・・2・・0・・・0・・・・0・・・・0・・5
マハゼ・・・0・・0・・・0・・・・0・・・・0・・6
キュウセン・0・・5・・・0・・・・2・・・・0・・0
ネズッポ・・0・・0・・・0・・・・0・・・・0・・0
クサフグ・・0・・0・・・0・・・・0・・・・6・・0
クロダイ・・4・・0・・・0・・・・0・・・・0・・3
==========================================================

 ふう。これで仕込みが終わりですね。

 たとえば、謎の赤い魚を検索しましょうか。

 ●謎の赤い魚、検索は「◎側扁◎赤◎無斑」を選んだとします。それぞれ
の標準評価との差をだして、それを加算して昇順に並べてみました。

==========================================
・・・・・◎体形・◎体色・◎斑紋・・・●計
マダイ・・・・0・・・0・・・1・・・・1
キュウセン・・0・・・2・・・6・・・・8
クロダイ・・・0・・・8・・・3・・・・11
マハゼ・・・・10・・・8・・・0・・・・18
ネズッポ・・・10・・・8・・・6・・・・24
クサフグ・・・10・・・8・・・6・・・・24
==========================================

 みごと!マダイがトップに出てきました。また、「無斑」を「横帯」で選
んだとしても順番は変わりません。少々、曖昧にやっても、びくともしない
強靱さの片鱗が、でているかな?

 大問題は、こそっと混ぜておいたクロダイより、キュウセンの方が、マダ
イと似ていると判定してしまったこと。これは、体形が同じだと、体色がき
いちゃったんでしょうね。このままで組んでしまうと、こういう例がばんば
んでてくると思われます。いや、ほんとうに似たもんに並んでくれるか、ち
ょっと不安もあります。

 これを防ぐには、生息場所とか、大きさとか、そういう項目を、増やすこ
とと、究極には、同じ科のものには、出てきた数字に、大きな修正をいれる
ようなことまで考えなければならないかもしれません。

 もうひとつ検索例をあげておきます。

 ●謎の茶色い魚。検索は「◎円筒◎茶◎無斑」を選びました。

==========================================
・・・・・◎体形・◎体色・◎斑紋・・・●計
マハゼ・・・・0・・・6・・・0・・・・6
ネズッポ・・・10・・・0・・・6・・・・16
マダイ・・・・10・・・8・・・1・・・・19
クロダイ・・・10・・・6・・・3・・・・19
キュウセン・・10・・・7・・・6・・・・23
クサフグ・・・10・・・8・・・6・・・・24
==========================================

 これは色がよくきいて、マハゼとネズッポが並び、赤でも黒でもないので、
クロダイとマダイが同点になっています。

 こういうこと、いちいち手作業でできないから、どんどん計算させて、さ
まざまな結果から修正を加えていくような作業が必要なんだろうな。

 じゅん坊さん、いままでの話し合いから、上のようなイメージを、ぼくは
持っていますが、この考え方で、だいたい合っているのでしょうか?

                         英人

[4345] Re:偏差法>ちょっとした雛型です 
2003/1/10 (金) 15:11:37 小西英人HomePage
 空白に中ぽつ(・)をいれても、崩れちゃったなあ。

 難儀やなあ。見にくいけど、わかるよね。      英人

[4347] 偏差法>雌雄や老幼はどうしよか… 
2003/1/10 (金) 18:02:22 小西英人HomePage
 そうそう、うえの雛型の中で、キュウセンは、雌雄どちらで選択されてもヒットするように、数値を、雌雄にだぶって入れていますが、よく考えると、検索結果を表示するのは、1種にひとつの写真だろうから、これは分けなければならないな。

 それとも、検索結果の表示サムネールが、1種の複数表示にも対応できるのなら、雌雄や、老幼は、まぜておいた方がいいのかもしれないな。

                            英人

[4349] Re2:偏差法>ちょっとした雛型です 
2003/1/10 (金) 20:07:18 KOUJI
▼ 小西英人さん

 詰らないように表示したい時は、「Pre」にチェックを入れるとスペースも詰まらない
表示になりますよ。
 ただ、改行もされないから、適当な所で改行して置く必要がありますが。

[4350] Re3:偏差法>ちょっとした雛型です 
2003/1/10 (金) 20:58:52 小西英人HomePage
▼ KOUJIさん

 どうもどうも、ごやっかいをおかけします。管理人のくせに、なにも分かっていないもんで…。直しておきました。

                         英人

[4348] RE: 偏差法>ちょっとした雛型です  
2003/1/10 (金) 19:58:46 じゅん坊
モデルを作りました
 簡易標準偏差のモデルをエクセルで作りました。簡単な仕組みだけど、取りあえずのシミュレーションは出来ますよ。

 シートは2枚あって、「基礎データ」シートはデータ入力・設定用で、これにデータを入力すると「設定結果」シートにデータベース上データと検索Keyの偏差結果が反映されます。shift+ctrl+S を押すと、「設定結果」は偏差合計順に並べ替えられます。shift+ctrl+R を押すと、元に戻ります。

 自由に入力できるのは。「基礎データ」シートの薄水色の部分のみです。検索Key部分の「項目1」・・・の部分は体型等の設定データ項目名で自由に設定できます。ここを直すと、他の部分の項目名称も自動的に変わります。

「名」の部分に魚名や種名を入れ、その行に各種設定データを入れて下さい。小数点以下1位まで設定できるようになっています。検索検索Keyは、HTML上での検索条件を想定して、整数で指定して下さい。

 まあ、標準偏差で行くと決まった訳じゃないけど、どの程度有効なのかは、これで調べられると思います。以下のサイトからダウンロードするか、直接開いて自分のPCにセーブしてください

http://fishing-forum.org/zukan/tmp/MODEL.xls

[4351] 偏差法>モデルですけど… 
2003/1/10 (金) 21:08:55 小西英人HomePage
▼ じゅん坊さん

 パソコン音痴だから、こうなると、ようわからん。

 このモデルは、たとえば、ぼくが3項目の形質に分けて、そのなかで、いろいろ分類したものを代入しようと思えば、この3項目を、ずらずらと並べていれていったらいいのかしら…。

 とにかく、ようわからん。エクセル、あんまし使っていないもんね。

                          英人

[4352] Re2: 偏差法>ちょっとした雛型です  
2003/1/10 (金) 21:34:07 小西英人HomePage
▼ じゅん坊さん

 エクセルになれないので、よくわからんところもあるのですが、ちょっと動かしてみて、思ったことを書きます。

 じゅん坊さんは、標準偏差でやってはりますね。この場合、たとえば5とすると、それに対して、3と7は同じばらつきになります。これって、数値設定のときに、かえって、ややこしくなりません?

 ぼくのつくった雛型は、最大値を設定して、それから、どれだけずれるかということだけで考えています。

 たとえば、魚の標準体型というようなものがあって、その標準体型に対して、ばらつきがあって、それが正規分布する場合は、じゅん坊さんの考え方でいいのですが、魚の場合、標準的なものはなく、たくさんの典型があって、それがすべての場合で標準であって、そのいろいろな典型に対して、どれほどの近似値をとるかということを加算して、近似度を並べるという方がいいのではないでしょうか?

 つまり、標準偏差は、よくないのではと思っています。

 ぼく、数字で世界を見ることができないし、パソコンは、エクセルでさえ、眼を白黒している、素人なので、ぼくが、いま、勘でいっていることが、あっているのか、間違っているのか、また、ぼくが雛型で割り出した数字が、どういう意味を持つのか、まったく分からずに書いています。

 ここまで書いて気がついたけど、キーの数値を設定して、それより低い数値だけをいれていったら、ぼくのいっているような数字になるはずだなあ。

 ぼくの考えているのと、じゅん坊さんの考えているのは、どんあ違いがあるのだろう。ようわからん。ご教示ください。

                         英人

[4353] モデル>やっぱり使い方がわからん…  
2003/1/10 (金) 22:37:01 小西英人HomePage
▼ じゅん坊さん

 情けないなあ。どうも使い方がのみこめないよお。

 パソコン音痴だからなあ。         英人

[4355] Re:モデル>やっぱり使い方がわからん…  
2003/1/11 (土) 00:22:06 小西英人HomePage
▼ じゅん坊さん

 それぞれの項目の中での、重みづけを検討するための計算ツールとして使えばいいのですね。

 やっと、わかりました。            英人

[4356] Re2:モデル>やっぱり使い方がわからん…  
2003/1/11 (土) 06:57:59 じゅん坊
 ども、英人さん。

 そうなんです、数値を設定する際の計算ツールとして作ってみたんです。ちょっとばかしバタバタしてたんで、今日にでも詳細を書こうとしてたら僕が思ってるより先を走ってた。最初、英人さんの呼び掛けに答えて、幾つかの方法を考えてみたんだけど、そこまで夢中になってるとは思ってもみなかった。(^_^;)

 始まってから4日程度しか経ってないのに、既に基本概念ができちゃったね。早いな〜。図鑑に関しては、僕の方が英人さんの勢いに追われてるって感じになちゃってます。お手柔らかにね。

 徹夜仕事も終わって、原稿をメールしたんで風呂入って寝ますね。お休みなさい。眠いゾ

[4357] Re3:モデル>やっぱり使い方がわからん…  
2003/1/11 (土) 07:04:39 小西英人HomePage
▼ じゅん坊さん

 ははは。忙しいときにごめん。

 検索って、ども使い勝手の悪いものだと思っていたのですが、そんなときに、ネットサーフィンしていて、マトリックスなんてみつけたもんだから、ついつい、いろいろ考えちゃって…。

 ゆっくりね。                    英人

[4354] 似たもの検索>項目を考えてみましょう 
2003/1/11 (土) 00:20:44 小西英人HomePage
▼みなさん

 ちょっとマトリックス法とか、偏差法とか、難しくしちゃったみたいですね。

 何がしたいか、もう一度、ここらでまとめておくと、ぶれの多い魚の検索を
するのに、そのぶれを生かして、おおまかに似たものをならべる方法はないか
ということです。たとえば、先ほどの体色の表でいえば…。

==========================================================
・・・・・青・・緑・・茶・・赤・・黄・・銀・・黒・背青黒
キュウセン6・・5・・1・・6・・2・・0・・0・・0
クサフグ・6・・6・・0・・0・・0・・0・・0・・6
クロダイ・0・・0・・2・・0・・0・・4・・8・・3
==========================================================

 キュウセンは、青と思っても、緑と思っても、赤と思っても、同じような
評価だし、黄色や、茶色と思っても、それなりの評価は得られ、検索に反映
することができます。

 クサフグも、青色と思っても、緑色と思っても、背が黒いと思っても、同
じ結果です。

 クロダイは、茶色、銀色、黒色、背黒色と思っても、それぞれの重みづけ
はありますが、検索に反映されます。

 これを集計して、どれかの種に落とすのではありません。あくまでも検索
ソフトは似たもの順に、サムネールを並び替えるだけです。あとは、その検
索者が判断するのです。

 これ、魚の検索法としては、かなり、面白いものになるのではないかと思
います。

 この検索法を、マトリックス法とか、偏差法とか、呼んでも、難しいし、
わかりにくいので、結果からとって、とりあえずわかりやすく「似たもの検
索」と呼びましょう。われらが【WEBさかな図鑑】は、目名と科名と和名の検
索だけでしたが、それに【似たもの検索】を追加するプロジェクトなのです。


 項目で言えば、KOUJIさんが色から見ると言ったので、色に重きを置こうか
と思ったけど、体色は変異のぶれがおおきいので、8点満点とし、ぶれにくい
形は10点満点としました。

 形、色、斑紋、この3つくらいで、やろうかなと思っていましたが、ちょっ
と極端な結果になりそうな気もするので、項目を増やそうかなと思います。

 体長を5点満点でいえば

==========================================================
全長cm・・10・・20・・30・・40・・50・・70・・90・・100以上
キュウセン4・・5・・1・・0・・0・・0・・0・・0
クサフグ・5・・5・・0・・0・・0・・0・・0・・0
クロダイ・1・・3・・3・・3・・2・・0・・0・・0
==========================================================

 というようにすれば、だいたいの大きさのところで、釣り人の釣りやすい大
きさを、幅を持って扱いながら、なおかつ、でてきやすい数字の所に重みづけ
もできます。

 こういう項目を、どんどん増やしたらどうかなと思います。

 みなさんも、項目、考えてね。              英人

[▼次のスレッド]