2. データの定期的な更新と仕組み作り
検索エンジンに好まれるタイプの一つに、最新情報を的確に提供するコンテンツが挙げられる。インターネットの世界では、情報の陳腐化は非常に早い。上位表示されていても変化を的確を反映できなければ、そのポジションに競合サイトが割り込んでくる。
インターネットには、作りっぱなし、あるいは更新が途切れているサイトが非常に多い。データを最新情報に保つことができていないサイトが多すぎる。
なぜか。ページを新たに作るよりも、継続的にメンテナンスする方が難しいからだ。
良いコンテンツの作成には情熱が必要である。その情熱を持続させることができれば、継続的なAdSense収入も現実味を帯びてくる。コンテンツ作成が生きがいであれば、情熱を継続することはさほど難しくはない。だが、たいていの人はそうでない。情熱を継続させるためには、何らかの仕組み作りが必要なのだ。
自分の場合、データを定期的に更新する必要があるジャンルを、意識的に選んでいる。毎日、毎週、毎月、必ずデータが更新されるものである。
定期的にデータ更新することを前提にすると、メンテナンス方法を含めて、コンテンツを構築する必要がある。つまりメンテナンスを前提とした仕組み作りが求められるのだ。
例えば求人情報。これは毎日のようにデータ更新が必要となる。メンテナンスは大変であるが、最初に仕組み作りをすれば十分クリアできる。仕組み作りができれば、他サイトと差別化できる可能性が高まる。
仕組み作りについて具体的に考えてみる。
求人データは厚生労働省職業安定局のハローワークが豊富である。まずはデータの二次利用等が法的に許容されるか否かを確認する。AdSenseは著作権侵害について厳しいので、他サイトのデータ利用時には慎重な対応が求められる。
サイトポリシーの「転載等について」「掲載情報の利用について」において明記されている。以下、引用する、
転載等について
当ホームページに掲載している情報について、出所を明記せずに転載を行うことを禁止します。また、当ホームページに掲載している情報を転載する場合は、転載先のホームページ内にサイトを運営する事業者名、所在地、電話番号を明示してください。
- 当ホームページ上の情報を転載する場合は、正確に記載するとともに更新を随時行い、常に最新の情報を掲載してください。
- 特に当ホームページにおいて提供する求人情報を転載する際は、更新を随時行い、求人内容を最新のものにするとともに、当ホームページ上で取り消しになった求人は速やかに掲載を取りやめてください。
- 上記を遵守していないと認められる場合は転載を禁止します。また、転載した情報について職業安定局、各都道府県労働局、ハローワークから要請があった際には速やかに修正、削除を行ってください。
掲載情報の利用について
掲載されている情報の利用に当たっては、求人・求職の結合を図るという、当ホームページの目的に沿って利用することとし、当ホームページの目的と関係のない営業等の対象にする行為等については、これを行うことを禁止します。
すなわち、以下の条件を満たせば求人データを転載することが可能となる。
- 出所を明記
- サイトを運営する事業者名、所在地、電話番号を明示
- 正確に記載するとともに更新を随時行い、常に最新の情報を掲載
- 取り消しになった求人は速やかに掲載を取りやめる
- 掲載されている情報の利用に当たっては、求人・求職の結合を図るという、当ホームページの目的に沿って利用
この中で難しいのが3.と4.である。逆に言えば、3.と4.をクリアするような仕組みを作れば、独自の求人情報サイトを継続運営することができる訳だ。
更に具体的に考えてみる。
データ取得方法だがAPIやRSSが用意されていないようなので、プログラムでページを巡回しながらスクレイピングでデータ収集することになりそうだ。例えば、UWSC等で巡回した後、PHP等でスクレイピングして、MySQL等のデータベースに求人データを格納する。ある程度のプログラミング技術があれば、さほど難しいことではない。
プログラミングの肝は、取得した求人データが、①新規案件なのか②継続案件なのか③条件が変更されているのか④取消案件なのか、の判断方法である。スクレイピング時に判断することになると思うが、ここさえ作り込めば、3.と4.をクリアすることができる。
例としてあげた求人データについては、定期的かつ自動的にデータ取得する仕組み作りを前提としたが、ジャンルによっては必ずしもプログラムを組む必要はない。求人データのように対象となるデータ数が多い場合は自動化プログラムでないと継続させることが難しいが、データ数が少なければ手動でも十分対応できる。
手動でのデータ更新が必要な代表例はキャンペーン情報である。
例えば光回線のキャンペーン情報サイトを構築すると仮定する。プロバイダ各社のキャンペーン内容のフォーマットはバラバラなので目視で確認する必要があるが、キャンペーン情報が100を超えることはない。よって作業自体はさほど多くない。期限がきても継続されるキャンペーンも多いので、更新作業は想像するより大変ではない。
ただし、ここでも仕組み作りがなければ継続することは困難である。なぜならば、データ更新作業は、非常に単調な作業なので、モチベーションを維持することが難しいからだ。お金のため、と割り切ってできる人であれば問題ない。そうでないならば、外注を使うなり、社員を雇うなりの対策が必要である。