法人、個人にかかわらず、自分以外の人が書いた記事を使うのであればコピペチェックツールは絶対に必要不可欠なものです。

 

外注している記事数が少ないから、といってもすべてを完全にコピペチェックはできません。人間には必ず「見落とし」ということが起こってしまいます。また巧妙に作られたものなら、ついスルーしてしまいます。

 

これまでに何十万記事を扱ってきましたので、これだけは自信を持っていえます。

最初のコピペチェックツールは完成まで半年を要しました


▲初代コピペエクスプレスのインターフェースです

 

さて、うちではこちらの要求を満たす「コピペチェックツール」を自社開発することにしました。理由はカンタンです。販売されているもので、こちらの要求を満たすものがなかったからです。

 

それらしいツールはありましたが、実際に使ってみるとWEB検索に限っていえばなかなか使い勝手のいいソフトはありませんでした。中には検出精度を疑うようなものまでさまざまです。

 

プログラマーに求めたのは次にような条件です
・15文字以上ネット上のすべてのソースとかぶるものを検出する
・検出先のURLの表示
・ロースペックでも動作するもの
・記事同士の比較、文字数のチェック
・ストレスのない検索速度

 

基本的にはこれくらいですが、実は製作に入ってから数多くの問題と直面してしまいました。

 

あまり細かい仕様は書けないことは、ご了承ください。一応企業秘密となっていますので。

 

ベータ版そのものは2ヶ月もかからず完成しましたが、山のようなバグが出ました。まずフリーズする、まるで関係のないものまで細かく拾ってきて、かえってチェックが出来なくなる、そのような問題の繰り返しです。

チェック項目とスピード


▲コピペは犯罪です

 

細かくチェックすることは簡単ですが、そうすると膨大な項目がコピペ判定されてしまいます。かと言って基準を下げてしまえば、肝心のコピペチェッカーとしての機能が失われてしまいます。

 

またどうしてもネット回線との接続は必要ですので、ある程度遅いADSLなどの環境でも動作するものが必要です。そしてPCスペック、これによってもチェック速度は大きく変わってきます。

 

このツールを作った頃はまだXP全盛でしたのが、その後VISTAやWIN7も登場し、すべての環境で動作するものが必要になりました。

 

最終的には何千記事単位で、いろんな環境での動作確認を行い、満足のできる「コピペチェック率」に到達するまでは結果として半年近くかかってしまいました。

 

基本的な仕組みは簡単ですが、実務レベルで「安心して使えるもの」になるのにはそれだけの検証時間が必要だということですね。

 

その後数年、このコピペチェックツールのおかげでどれだけ仕事がはかどるようになったかは語り尽くせないほどです。

コピペチェックツールの決定版