中辞郎スクリプト
早速ググっていらした方がいるようなので、サクッと公開します。といってもはてなはファイルをアップできないのでテキストで。
以下をeimin.plという名前のファイルに保存すれば、以前公開していたものと同じです。(単に、1語が6字以上のbig wordを2語組み合わせた熟語と、16文字以上の熟語を探して除外するのと、用例を削除することで、英辞郎を小さくするというものです。)
#2語の熟語で、 #1語が6文字以上のもの #16文字以上の熟語 #用例を削除 while(<>){ if(m#^(.+) /// (.+)$#){ $flg = 1; $word = $1; $text = $2; $line = $_; if($word =~ / /){ #熟語なら if(length($word) > 15){ $flg = 0; } elsif($word =~ /([A-Za-z]+) ([A-Za-z]+)/){ if(length($1) > 5 && length($2) > 5){ $flg = 0; } } } if($text =~ m#/#){ $text =~ s#/ .+##g; } } if($flg){ print $word.' /// '.$text."\n"; } }