webmail开发小记最近这三个月是到北京以来最干燥的三个月,以至于我的mp3因为静电频频重启,垃圾sony!鼻孔开
webmail开发小记
最近这三个月是到北京以来最干燥的三个月,以至于我的mp3因为静电频频重启,垃圾sony!鼻孔开始起皮皮、嘴也开始裂口子,唇膏什么的根本不管用,喝水才素王道,于是每天一个小时一趟厕所,也好能多活动活动。
八月底开始着手做webmail的时候想从网上搜些信息参考,能找到的基本都是介绍javamail的API,几乎找不到什么开发webmail思路的资料。目前我们的项目已经到了收尾阶段,也比较闲,我想总结一下我的思路,与同学们共同学习。
我们邮件服务器用的是开源的James,由于当前版本不支持IMAP所以只能用POP3协议。使用POP3协议在开发上会带来很多麻烦,比如POP3服务器只有INBOX文件夹、不能为邮件加标签等,这些问题我是这样考虑的,先从服务器上收邮件,把邮件主要的头信息和相关信息存数据库,如:邮箱地址、标题、大小、是否已读、发件人等等;邮件存本地硬盘,只有读某封邮件的时候再从硬盘上读(类似上传附件的思路),当然也可以存数据库,不过如果邮件很大这张表就太恐怖了。
这样做每次收邮件都会从服务器上删除已收到的,没有解决的问题是如何不从服务器上删除而又不会每次收都收到重复的,百思不得其解,时间关系也没有再仔细研究。
webmail部分的邮件过滤其实很简单,因为规则是用户订的,可以允许客户匹配标题、发件人、内容等等。接收邮件的同时匹配一下,如果符合过滤规则把记录的状态改成垃圾邮件箱或拒收就是了。阻止发件人的功能也是这么做的,其实邮件服务器上还是收到了这封邮件,只不过没有收到webmail里。
别的好像也没有什么好说的,不是说开发过程中没有遇到什么问题,相反,我们不断碰到问题解决问题,不过没有多少太深刻的,很多朋友可能对解析邮件比较头大,我说一下我的思路,也欢迎大家一起讨论
邮件的结构如下图所示,如果能吃透这张图,解析起来就明朗多了。我们要做的是判断Part是什么类型
if (!part.isMimeType("text/rfc822-headers") && part.isMimeType("text/*")){//说明这部分是邮件内容//注意内容分为text/plain和text/html两种 显示的时候要区别}else if (p.isMimeType("multipart/*")) {//遍历Multipart中的part 逐一递归本方法}else if (p.isMimeType("message/rfc822")) {//递归调用本方法}else {//这时很有可能说明改part是附件 按附件处理}
这里每步解析都可能会抛异常,那也没办法,不与理睬,不过一封正常的邮件应该没什么问题
p.s. 前半部分是年前写的,一直在草稿箱里,今天忽然想起来了赶紧补充一下,相关问题欢迎交流讨论 1 楼 dualface 2008-03-28 这样做出来的 webmail 是没法用的。
webmail 必须直接从邮件系统底层入手做。如果基于 pop3 和 imap 协议来做,邮件量一大就挂了。
例如垃圾邮件处理。绝大部分垃圾邮件都有一个特征,就是格式不规范。所以在 smtp 那里入手就可以确保垃圾邮件不进入系统。然后白名单、黑名单等,都要在这里做。不然你黑名单上的人给你发信,一样发进来了。只不过 webmail 显示的时候给过滤掉了。
还有邮件解析,也不能显示的时候才去读出来解析,那样的话碰上个一些带有大附件的邮件,会死得很难看。应该是邮件分发的地方就对邮件解析(实际上这里本来就要解析的),然后把部分解析结果存储起来。webmail 到时候调用来显示就行了。比如说邮件列表要显示邮件有没有附件、附件多大、是什么类型的,这个需求靠显示时解析是不现实的。
以前我就是做 webmail 的,当初做新产品曾经想过基于 imap 协议来做。因为 imap 协议不用读取整个邮件就可以获得信件头等信息。但后来做起来才发现标准的 imap 提供的功能根本不够,如果要扩展 imap 协议,还不如从底层邮件系统入手。
现在 postfix 是扩展能力、性能、安全性各方面都比较平衡的邮件系统,用来做底层比较方便。qmail 就太老了,而且很多功能都是靠第三方程序来实现。 2 楼 Marvin 2008-03-28 多谢前辈启发,小弟以前对webmail没有一点了解,硬着头皮上的,都是凭想象和参照claros的in touch做的。
引用webmail 必须直接从邮件系统底层入手做。如果基于 pop3 和 imap 协议来做,邮件量一大就挂了。
请问从系统底层入手是使用java还是其他语言,能不能再说的详细一点,我们的客户是局机关,最多的点也就百十来人,目前测试还算顺利。
引用例如垃圾邮件处理。绝大部分垃圾邮件都有一个特征,就是格式不规范。所以在 smtp 那里入手就可以确保垃圾邮件不进入系统。然后白名单、黑名单等,都要在这里做。不然你黑名单上的人给你发信,一样发进来了。只不过 webmail 显示的时候给过滤掉了。
垃圾邮件的过滤一直比较头疼,邮件服务器用的是james,拿来改了改,能保证一些规则的邮件不进到james里,(至于webmail的过滤规则是用户定的,是从james到webmail时的过滤,)但是过滤效果一直不好,还没摸着规律。郁闷中..........
引用还有邮件解析,也不能显示的时候才去读出来解析,那样的话碰上个一些带有大附件的邮件,会死得很难看。应该是邮件分发的地方就对邮件解析(实际上这里本来就要解析的),然后把部分解析结果存储起来。webmail 到时候调用来显示就行了。比如说邮件列表要显示邮件有没有附件、附件多大、是什么类型的,这个需求靠显示时解析是不现实的。
这个基本上和前辈说的差不多,我们也做过测试,速度还凑合
引用以前我就是做 webmail 的,当初做新产品曾经想过基于 imap 协议来做。因为 imap 协议不用读取整个邮件就可以获得信件头等信息。但后来做起来才发现标准的 imap 提供的功能根本不够,如果要扩展 imap 协议,还不如从底层邮件系统入手。
现在 postfix 是扩展能力、性能、安全性各方面都比较平衡的邮件系统,用来做底层比较方便。qmail 就太老了,而且很多功能都是靠第三方程序来实现。
还有我想请教一下文中提出的问题,webmail收邮件时邮件服务器上保存邮件(如果现在这样做的话webmail再收信又会把收过的邮件再收一遍),请问前辈有没有解决的方案? 3 楼 fishelf 2008-03-29 顶顶~~~~~~~~~~··