sitemap.xml エスケープ文字
Memoです。
sitemap.xmlでアンパサなどのエスケープ文字は次となります。
Character | Escape Code |
---|---|
& | & |
' | ' |
" | " |
> | > |
< |
引用元:http://www.seo-service.net/seo-blog/memo/sitemaps_xml_format_-_sitemaps_02.html
■
また、
以前はGoogleウェブマスターツールでは、
1つのsitemap.xmlに記述できる上限が500まででしたが、
現在は、ファイルサイズが10M以内か、50,000URLまでOKのようです。
サイトマップファイルの索引の作成(URLリストを分割する) Sitemapファイルは複数に分割することができる。 しかしそれぞれのSitemapファイルに載せることのできるURLの数は50,000までで、ファイルの容量は10MBまででなければならない。 容量を10MB以内に収め、サーバーに負荷をかけないためにgzip形式にて圧縮しても構わない。 Sitemapファイルに載せたいURLが50,000以上ある場合はSitemapファイルを分ける必要がある。 複数のSitemapファイルを提供したいときはそれぞれのSitemapファイルをSitemapファイルの索引ファイルの中にリスト化する。 Sitemapファイルの索引に掲載できるURLの数は1,000までで、10MBを超えてはならない。この索引ファイルのXMLフォーマットはSitemapsファイルのものとよく似ている。 その他、Sitemapプロトコルでは下記の規制がある。 ・というタグで始まり、というタグで終わること ・親のXMLタグとして、個々のURLごとにタグを記入すること ・個々のタグに子要素としてを含ませること オプション・タグであるは索引にも同様に使用できる。 注)索引は同じサイト上にあるものしか指定できない。例えばhttp://www.yoursite.com/sitemap_index.xmlはhttp://www.yoursite.com上にあるSitemapファイルを読み込むことができるが、http://www.example.comやhttp://yourhost.yoursite.com上にあるファイルは読み込むことができない。また、索引もUTF-8で記述すること。
引用元:http://www.seo-service.net/seo-blog/memo/sitemaps_xml_format_-_sitemaps_02.html