假如你使用iTunes,请忽略本篇文章。
----正文分割线----
某些情况下,某些Podcast的站长可能会粗心忘记在自己的网站上公布rss地址,或者像itings.com这样的网站托管的博客,你在我的页面上找来找去也找不到rss地址。或者你要使用编程语言写一个批量采集程序,把iTunes Store里的Podcast直接抓取下来,这时候你就需要通过iTunes Store直接获取rss地址,而iTunes Store本身是不提供的。这篇文章就是讲这个事情。
不废话,直接说原理:通过抓包容易发现iTunes通过访问一个地址来获取真实的rss地址,这个地址是:
https://buy.itunes.apple.com/WebObjects/MZFinance.woa/wa/com.apple.jingle.app.finance.DirectAction/subscribePodcast?id={ID}&wasWarnedAboutPodcasts=true
其中的ID,就是你在iTunes Store地址中看到的ID。我们拿知名的“闲白儿电台”举个例子:
闲白儿电台在iTunes Store中的地址是:http://itunes.apple.com/us/podcast/xian-bai-er-dian-tai/id531733337
但是同样的地址你用浏览器访问,返回的东西却不一样,原因很简单----http头中的User-Agent不一样。iTunes使用一个类似乎“iTunes/版本号”的User-Agent记号。你可以随便找一个比较新的版本,比如“iTunes/10.4.1”。只要这样设置,返回的结果中就会包含真正的rss地址。
我们使用Chrome试一下:
在Chrome中按F12打开调试工具,然后按右下角的齿轮按钮,就会弹出下面的界面,我们可以修改User-Agent,如图:
然后我们访问上面的地址,就不会返回一个网页,而是一个xml文件,这个文件是一个叫做NeXTSTEP format的东西,不用管太多,只要找到下面两行就好:
这里面的url就是rss地址了。
OK,到此就明了了,如果你要使用编程语言实现这个过程,只要照方抓药就要。