企业做网站网站归档技术和标准不完备

日期 : 2021-10-03 22:49:44
        网站归档技术和标准不完备。网页信息采集主要针对静态或动态网页及其中文件,随后提取网页内的全部信息。静态网页与动态网页的抓取难度也不相同,静态网页的抓取从技术上较易实现,只需按时间频率定期进行即可;而动态网页的捕获则无法单纯依靠抓取软件实现,且以目前的技术条件无法实现安全存储。此外,随着网页技术不断发展,网页文件类型和格式不断更新。

        除了传统的HTML格式文件以外,Java文件、Ac-tive X文件、Jpg图片文件等新型格式的网页文件也层出不穷,但目前尚未有明确标准规范来指导这些文件归档。

相关文章