サイト内検索(GSCP)で何を日付データとして取得していますか?

変更日 月, 28 7月 で 11:48 午前

日付データは、HTMLコンテンツと PDFコンテンツで取得方法が異なります。


■ HTML

デフォルト設定:次の順で日付データの有無を確認し、存在すればそれを日付と判断します。

① HTMLソースmetaタグの pf:last_modifiedに設定された content日付 例) <meta name="pf:last_modified" content="2024-01-23T12:34:56+09:00"> ※指定可能なフォーマットは後述します。

② HTMLソースmetaタグのdateに設定されたcontent日付 例) <meta name="date" content="2024-01-23T12:34:56+09:00">

③ HTMLソース JSON-LD における dateModified

④ HTMLソース JSON-LD における datePublished

⑤ WebサーバからレスポンスされるHTTPヘッダーのLast-Modified ※curlコマンドやブラウザの開発者モードで確認することができます。WebサイトによってはHTTPヘッダーに含まれないことがあります。HTMLソースに①~④がなく、⑤も含まれない場合は、日付データなし、となります。


[指定可能フォーマット]

YYYY-MM-DDThh:mm:ss+09:00

YYYY-MM-DDThh:mm:ss+0900

YYYY-MM-DDThh:mm:ss.xxx+09:00

YYYY-MM-DDThh:mm:ss.xxx

YYYY-MM-DDThh:mm:ss

YYYY-MM-DDThh:mm:ss GMT

YYYY-MM-DDThh:mm:ss UTC

YYYY-MM-DD hh:mm:ss+09:00

YYYY-MM-DD hh:mm:ss+0900

YYYY-MM-DD hh:mm:ss.xxx+09:00

YYYY-MM-DD hh:mm:ss.xxx

YYYY-MM-DD hh:mm:ss

YYYY-MM-DD hh:mm:ss GMT

YYYY-MM-DD hh:mm:ss UTC

YYYY-MM-DD



■ PDF

デフォルト設定:WebサーバからレスポンスされるHTTPヘッダーのLast-Modified

カスタマイズ設定により、PDFファイルプロパティ内「作成日」に調整することが可能です。


この記事は役に立ちましたか?

それは素晴らしい!

フィードバックありがとうございます

お役に立てず申し訳ございません!

フィードバックありがとうございます

この記事に改善できることがあれば教えてください。

少なくとも一つの理由を選択してください
CAPTCHA認証が必要です。

フィードバックを送信しました

記事の改善におけるご協力ありがとうございます。