面向科学的低带宽通信工具
知识的传播和管理对于科学事业和可持续发展至关重要。几十年来,意大利的阿卜杜勒·萨拉姆国际理论物理中心 (ICTP) 特别关注发展中国家的需求,通过培训和研究,促进科学进步。
中心很久以前就认识到互联网上信息检索系统的重要性,包括内部预印本、年度活动和公共访问目录的发布。
在技术层面,Linux 为我们提供了一种经济高效的替代方案,以促进远程电子协作(参见“资源”)。基于 Linux 操作系统,虚拟实验室和数字通信工具的广泛使用可以帮助减少科学孤立,同时以前所未有的方式满足向南半球发展中国家转移知识的需求(参见“资源”)。
遵循这些原则,我们已开始构建原型在线科学工具,以进一步加强电子协作,并支持通过电子邮件使用网络导航和数据库搜索。下面,我们介绍萨拉姆 ICTP 为低带宽科学界提供的两种工具。这两个软件包都使用了最先进的技术和内部开发的软件,并根据 GNU 通用公共许可证 (GPL) 分发。
ICTP 的 www4mail 软件允许使用任何标准网络浏览器和 MIME(多用途互联网邮件扩展)感知电子邮件程序,通过电子邮件导航和搜索整个互联网。乍一看,它可能类似于几种网络到邮件软件接口之一;但 www4mail 程序引入了以前不可用的新功能。简而言之,当在浏览时选择指向其他网站的链接时,包含过滤后的 HTML 页面的电子邮件会自动传递到 www4mail 服务器。
该程序用模块化的 Perl 编写,允许检索网页、搜索任意数据库、填写 Web 表单(GET 和 POST 执行 Web 数据库搜索)以及跟踪链接(在线浏览),所有这些都通过电子邮件完成。它是多语言的,易于管理,并支持当前的互联网标准(MIME、HTML 4.0 等)。
www4mail 从头开始在 Linux 平台上开发,已在 BSD 平台上成功使用,并包含一些可选的、特定于 Linux 的优化。例如,www4mail 可以直接从 Linux /proc 文件系统监视系统负载平均值,并在高负载平均值时,将请求排队以供稍后处理。
以下是 www4mail 的一些主要功能
根据电子邮件客户端通过 Web 浏览器发送的请求选项类型,将回复作为电子邮件附件或电子邮件正文发送
一旦浏览器可以显示脚本,就支持脚本
传递大多数类型的 Web 文档,包括 JavaScript 和 cookie
处理动态内容,解析文本 HTML 和源代码 HTML
保留请求网页的原始布局
从 FTP 站点和 Usenet 新闻服务器检索信息
处理元标记;也就是说,如果网页通过使用元语句重定向或重新定位,www4mail 会自动警告可能的信息重新定位,并在回复页面的顶部提供指向新位置的合适链接
处理框架,插入指向每个框架文档的合适链接
支持密码保护的 Web/FTP 站点的用户身份验证
捕获错误消息并将它们发送回用户
为与替代的“Agora”和“GetWeb”网络邮件服务器兼容,提供纯文本访问支持
提供过滤后的请求以减少带宽
支持二进制数据传输
允许将网页下载为 PostScript 文件,以便在本地查看或打印(有关手册,请参见 http://www.ictp.trieste.it/~www4mail)
4.23.00 - 自 5 月 1 日起,它位于 C-edit 目录中。

www4mail (参见图 1 中的徽标)的开发主要目的是帮助来自发展中国家的研究人员仅使用电子邮件和慢速互联网链接浏览网络。虽然网络上的信息量在过去几年中呈指数级增长,但仍然有大量的互联网用户只能访问电子邮件,或者他们的互联网提供商不提供完整的互联网连接(他们中的一些人仍然使用 UUCP),或者他们无法负担得起具有完整互联网功能的昂贵帐户。这些用户中的许多人居住在发展中国家的农村地区,依靠电子邮件来访问基本的医疗和商业信息,以及进行人际交流和了解世界新闻。能够通过一封简单的电子邮件查询可用的数据库(例如 AltaVista、HotBot 等)或预印本存储库,并在几分钟(或几小时)内收到输出,可以极大地帮助他们的科学工作。
目前,可以通过向 www4mail@wm.ictp.trieste.it 或安装了网关的任何其他地方(例如,Bellanet-Canada,www.bellanet.org/email.htm)发送电子邮件消息来测试 www4mail,并在消息正文中列出请求的 URL。
目前有 50 多个服务器配置选项可用于设置参数,例如每个用户的最大配额、网关管理员、每个请求的最大大小或拆分大文件的大小。(在电子邮件消息正文中键入 help 以获取更多详细信息)。
服务器的安装过程很简单。例如,在 Red Hat Linux 下,创建一个名为 www4mail 的用户帐户 (adduser www4mail),以用户 www4mail 身份登录 (su - www4mail),在 www4mail 的主目录中提取 tar 存档 (tar zxvf www4mail.tar.gz) 并执行一些额外的操作(例如,启用转发)。有必要从可执行文件 /home/www4mail/bin/www4mail 创建一个链接到 /etc/smrsh 子目录,以使 sendmail MTA(邮件传输代理)正常工作。为了优化其配置,需要进行一些初步监控。
www4mail 对来自许多不同国家/地区的许多人非常有用,通常每天收到超过 12,000 个请求。您可以在 http://web.bellanet.org/www4mail/) 查看每周统计数据。

ScientificTalk(参见图 2 中的徽标)是科学家、学生和教师通过网络浏览器交换信息的专业原型工具,以同步方式显示数学方程式。该项目的重点是用户对数学和科学符号等内容的兴趣。我们的动机源于 Web 的早期目标,即成为可读写的协作媒介。
不幸的是,HTML 4.0 语言的大型标签库不适合数学,因为它们无法标记复杂的数学表达式。通常,为了创建包含数学或科学内容的技术文档,Web 作者会求助于涉及图像的方法(例如,方程式的屏幕截图),这意味着讲师、学生等共享学术和科学材料通常需要多个步骤。有一些可用的 applet 和插件可以在浏览器中渲染 MathML(这些 applet 和插件不一定是为了同步协作而设计的)。
数学标记语言 MathML 是 W3C 的一项建议,它为在网页中包含数学表达式提供了基础。作为可扩展标记语言 (XML) 的应用程序,并且在足够的样式表支持下,MathML 最终将使浏览器能够原生渲染数学表达式,包括线程式在线讨论。(目前有一些 applet 和插件可用,可以在浏览器中渲染 MathML。)有关技术/科学文档查看器和渲染器的完整列表,请参阅 W3C,网址为 http://www.w3.org/Math/,例如 Scientific MessageBoard WebEQ、IBM techexplorer、EzMath 编辑器和 LaTex2HTML。
ScientificTalk 是用于标准多向图形网络聊天的 Perl 脚本。这个基于 CGI 的应用程序是跨平台的,允许查看占用者、向特定用户发送输入等。在在线聊天时,它会将文本输入或标准 LaTeX(一种流行的计算机语言,用于编写高质量印刷的格式化科学文本)转换为 HTML。由于 LaTeX 排版和 Ian Hutchinson 强大的 TeX-to-HTML 转换器 tth,浏览器上显示的数学内容非常丰富,该转换器可在 http://hutchinson.belmont.ma.us/tth/ 获取。
对于那些不熟悉 LaTeX 命令的人,ScientificTalk 有一个外部符号键盘以及一个用于用户输入的作曲家和消息窗口。无需额外的插件或高速网络——所有输入都仅通过文本模式传递。在客户端,Netscape(v4.0 或更高版本)需要一个简单的字符集配置(有关详细信息和演示,请连接到 http://sv7.ictp.trieste.it/。
虽然 ScientificTalk 原型已经证明,今天可以在远程客户端之间在 Web 上进行同步数学讨论,但我们的待办事项列表仍然很长。例如,将完整会话保存为 LaTeX 文件(以便从给定的会话重新启动在线讨论或在 Web 上协作编写 LaTeX 文档)、显示给定函数的绘图、创建小的透明 .gif 文件以及将其语言功能扩展到其他领域的符号(例如化学)将非常有用。
Enrique Canessa 博士 (canessae@ictp.trieste.it) 是一位理论物理学家,目前在 ICTP 担任科学顾问。他的主要研究和兴趣领域是凝聚态物理和科学软件应用领域。自 1987 年以来,他一直沉迷于互联网。
Clement Onime