新闻动态

如何建设自己的多语言版本的网站?

  多语言网站是指所提供的内容含有两种以上语言的网站。多语言网站的例子包括:加拿大公司的网站有英文及法文版本,或是有关拉丁美洲足球的资讯同时提供西班牙文和葡萄牙文版本。
  多地区网站是指明确锁定不同国家/地区使用者的网站。某些网站既是多地区网站,也是多语言网站(举例来说,一个网站可能会有美国和加拿大地区两种版本,而加拿大地区的内容又同时含有法文和英文版本)。
  如何建设自己的多语言版本的网站?
  管理网站的多重地区版本
  以下是一些提示,可供您确认本地化的内容是否出现在适当语言的搜寻结果中。
  确认网页的语言相当明确
  Google只会使用网页上显示的内容来判断网站语言。并不会使用任何语言代码,例如lang属性。您可以针对每个网页的内容和浏览项目使用单一语言,并避免将翻译内容与原文并排显示,以协助Google正确地判断网页语言。如果以单一语言保留大部分内容的同时,只翻译网页上的重复性文字(通常发生这种情况的页面都含有使用者产生的内容),则含有各种重复性语言的搜寻结果中,如果多次出现相同的内容,就可能会留给使用者不好的印象。
  使用robots.txt可以防止搜寻引擎检索网站上自动翻译的网页。自动翻译有时词不达义,可能会被视为垃圾内容。更重要的是,劣译或呆板不顺口的翻译,可能让网站的浏览者反感。
  确认各个语言版本都能很容易找到
  将各个语言的内容存放在不同的网址中。请不要使用Cookie来显示网页的翻译版本。考虑让各种语言版本的网页都能相互连结。这样一来,浏览德文版网页的法文使用者只需按一下连结就能连往适合他的语言版本。
  避免自动判断使用者所用语言并重新导引到该语言版本。这些重新导向动作可能会让使用者(以及搜寻引擎)无法检视您网站的所有版本。
  谨慎选择网址
  Google是根据网页的内容来判断其语言,但是网址本身也能够让使用者判断网页内容。例如,下列.ca网址的子网域或子目录使用fr来表示其内容为法文:http://ccxcn.ca/fr/vélo-de-montagne.html和http://fr.ccxcn.ca/vélo-de-montagne.html.
  在网址中注明语言也能够帮助您找出网站中多语言内容的问题。
  您可以翻译网址中的文字,也可以使用国际化网域名称(IDN)。请务必在网址中使用UTF-8编码(事实上,我们建议尽量都使用UTF-8),并记得让这些在连往这些网址时,以正确的逸出字元作为网址。
  将网站内容锁定为针对特定国家/地区
  如果Google察觉到某个网站的目标国家/地区,就能够利用此资讯来改善不同国家/地区的搜寻结果品质。Google通常会使用下列元素来判断网站锁定的目标国家/地区:
  国家代码顶层网域名称(ccTLDs)。这些名称受限于特定国家/地区(例如,.de表示德国、.cn表示中国),因此对使用者和搜寻引擎两者来说,是表示网站明确锁定特定国家/地区的显著指标(有些国家/地区对于ccTLD的使用者有所限制,所以请务必先了解详情)。我们也会将较少人使用的ccTLD(例如.tv、.me、etc.)视为gTLD,因为我们发现相较于以国家为目标的代码,使用者和网站管理员经常认为这些代码更加普通(我们没有完整的清单可记录我们视为gTLD的ccTLD,因为这份清单会随时改变)。查看Google的一般网域完整清单。
  地理定位设定。您可以使用网站管理员工具中的指定国家/地区工具,向Google指定网站锁定的目标国家/地区。您的网站必须要有一般顶层网域名称,才能这么做。但是,如果您的网站锁定了多个国家/地区,则请勿使用这项工具。例如,将介绍蒙特娄当地餐厅的网站设定以加拿大使用者为目标就很有道理,但是将那些着重于法国、加拿大和马利等法语使用者的网站,设定以加拿大使用者为目标,就不太合理。
  注意:因为地区性顶层网域(例如.eu或.asia)并非指定单一国家/地区,所以Google会将其视为一般顶层网域。
  伺服器位置(透过伺服器的IP位址判定)。伺服器位置通常邻近您的使用者所在地区,也可能透露网站的目标群众所在。某些网站会使用分散式内容传送网路(CDN),或是将主机架设于网路伺服器基础架构较佳的国家/地区,此时的位置就不具指标意义。
  其他指标。其他有关您网站目标群众的线索来源还包括网页上的当地住址和电话号码、是否使用当地语言和货币、来自其他当地网站的连结和/或是否使用Google我的商家(如果有)。
  Google不会使用位置中继标记(例如geo.position或distribution)或HTML属性来进行地理定位。
  网址结构
  考虑使用网址结构,这可以让您将网站内容依照不同地理区域加以划分。请参考以下表格,以便了解您可以选择的方法有哪些:
  地理定位并非100%准确,所以您必须设想,当使用者浏览到错误的网站版本时,您应该怎么做。在所有网页上显示连结,让使用者能够自行选择地区和/或语言,便是一种可行的作法。
  重复的内容和国际网站
  有时候,这类针对不同地区提供特定内容的网站,如果又同时提供了多种语言版本,便可能会在不同的网址上放置相同或类似的内容。只要该内容是针对不同国家/地区的使用者,通常就不成问题。虽然我们强烈建议针对各种不同族群的使用者提供不同的内容,但是要做到这一点并不容易。一般来说,在robots.txt档案中禁止检索,或是使用"noindex"漫游器中继标记,就不需要「隐藏」重复的内容。但是,如果您在不同网址上提供同样的内容给相同使用者(例如,如果ccxcn.de/和ccxcn.com/de/同时显示了给德国使用者的德文内容),就应该选一个偏好的版本,并适当地进行重新导向(或使用rel=canonical连结元素)。此外,建议您按照rel-alternate-hreflang指南,确认您已向搜寻资讯的使用者提供正确的语言或区域网址。
  针对多语言网站,NC会采用同一网域、子资料夹、各别资料库方式,或是不同网域、上层资料夹、各别资料库。
  当采用不同网域规格时,我们可以提供美国HE主机、香港IBM主机、台湾HINET主机、北京主机(需要搭配.cn网域跟主机备案)、英国主机。