sitemap.xml エスケープ文字



Memoです。
sitemap.xmlでアンパサなどのエスケープ文字は次となります。

Character Escape Code
& &
' '
" "
> >
<

引用元:http://www.seo-service.net/seo-blog/memo/sitemaps_xml_format_-_sitemaps_02.html



また、
以前はGoogleウェブマスターツールでは、
1つのsitemap.xmlに記述できる上限が500まででしたが、
現在は、ファイルサイズが10M以内か、50,000URLまでOKのようです。

サイトマップファイルの索引の作成(URLリストを分割する)
Sitemapファイルは複数に分割することができる。
しかしそれぞれのSitemapファイルに載せることのできるURLの数は50,000までで、ファイルの容量は10MBまででなければならない。
容量を10MB以内に収め、サーバーに負荷をかけないためにgzip形式にて圧縮しても構わない。
Sitemapファイルに載せたいURLが50,000以上ある場合はSitemapファイルを分ける必要がある。
複数のSitemapファイルを提供したいときはそれぞれのSitemapファイルをSitemapファイルの索引ファイルの中にリスト化する。
Sitemapファイルの索引に掲載できるURLの数は1,000までで、10MBを超えてはならない。この索引ファイルのXMLフォーマットはSitemapsファイルのものとよく似ている。
その他、Sitemapプロトコルでは下記の規制がある。
・というタグで始まり、というタグで終わること
・親のXMLタグとして、個々のURLごとにタグを記入すること
・個々のタグに子要素としてを含ませること
オプション・タグであるは索引にも同様に使用できる。
注)索引は同じサイト上にあるものしか指定できない。例えばhttp://www.yoursite.com/sitemap_index.xmlhttp://www.yoursite.com上にあるSitemapファイルを読み込むことができるが、http://www.example.comhttp://yourhost.yoursite.com上にあるファイルは読み込むことができない。また、索引もUTF-8で記述すること。

引用元:http://www.seo-service.net/seo-blog/memo/sitemaps_xml_format_-_sitemaps_02.html