中辞郎スクリプト

早速ググっていらした方がいるようなので、サクッと公開します。といってもはてなはファイルをアップできないのでテキストで。
以下をeimin.plという名前のファイルに保存すれば、以前公開していたものと同じです。(単に、1語が6字以上のbig wordを2語組み合わせた熟語と、16文字以上の熟語を探して除外するのと、用例を削除することで、英辞郎を小さくするというものです。)

#2語の熟語で、
#1語が6文字以上のもの

#16文字以上の熟語

#用例を削除

while(<>){
	if(m#^(.+) /// (.+)$#){
		$flg = 1;
		$word = $1;
		$text = $2;
		$line = $_;
		if($word =~ / /){
			#熟語なら
			if(length($word) > 15){
				$flg = 0;
			}
			elsif($word =~ /([A-Za-z]+) ([A-Za-z]+)/){
				if(length($1) > 5 && length($2) > 5){
					$flg = 0;
				}
			}
		}
		if($text =~ m#/#){
			$text =~ s#/ .+##g;
		}
	}
	if($flg){
		print $word.' /// '.$text."\n";
	}
}