pop 是一个相对古老的协议。第一个版本是在 1984 年指定的。至今仍在使用的版本 pop3 是在 1996 年指定的。为了尝试一下,我开始连接到 gmail pop3 服务器。

第一步是查找 pop3 设置 - 连接到哪个服务器、连接哪个端口。谷歌引导我来到这里,我在那里找到了以下信息。

pop.gmail.com 需要 ssl:是 端口:995

它提到需要 ssl。 25 年前,当我最后一次摆弄 pop 时,我还没有处理过这个问题。我担心这会让人头疼,但事实证明这并不是什么挑战;在 python 文档的帮助下,我得到了这段代码。

import socket
import ssl

hostname = 'pop.gmail.com'
context = ssl.create_default_context()

with socket.create_connection((hostname, 995)) as sock:
    with context.wrap_socket(sock, server_hostname=hostname) as s:

它会连接,并告诉我正在使用的 ssl 版本......或者其他什么。伟大的成功!是时候开始与服务器对话了。

借用 pop3 的官方 rfc,这是客户端和服务器之间的 pop3 对话示例/

c: <open connection>
s:    +ok pop3 server ready 
c:    user mrose
s:    +ok mrose is a real hoopy frood
c:    pass secret
s:    +ok mrose's maildrop has 2 messages (320 octets)
c:    stat
s:    +ok 2 320
c:    list
s:    +ok 2 messages (320 octets)
s:    1 120
s:    2 200
s:    .
c:    retr 1
s:    +ok 120 octets
s:    <the pop3 server sends message>
s:    .
c:    quit
s:    +ok dewey pop3 server signing off (maildrop empty)
c:  <close connection></close></the></open>


当您要求从套接字接收数据时,您必须指定缓冲区大小。文档建议使用 2 的幂,例如 4096。来自服务器的许多响应将同时通过。有些不会;有些则不会。有时来自服务器的消息会在服务器读取时被破坏,并且即使还有更多消息,缓冲区也可能不会填满。

对于 pop3,判断消息是否已传入的方法完全取决于传入的消息。大多数情况下,服务器发送单行文本。 (正如我们稍后将再次看到的,它们在每行末尾都有一个回车符和换行符。)某些可能具有更长响应的消息使用另一种方式来显示它们已完成:单行上的句点就其本身而言。

import socket
import ssl

hostname = 'pop.gmail.com'
context = ssl.create_default_context()

with socket.create_connection((hostname, 995)) as sock:
    with context.wrap_socket(sock, server_hostname=hostname) as s:
        data = s.read(4096)


您必须将缓冲区大小传递给读取方法。然后它将有一个缓冲区,其大小可用于从服务器读取数据——但不能保证一次有多少数据进入缓冲区。这意味着协议需要某种方式来指定消息何时完成。有多种可能的策略。 pop 使用两个:对于所有消息,行都以 rn 结尾。对于短(一行)消息,这就是所需要的。对于多行响应,一行上的句点表示消息已完成。

b'+ok gpop ready for requests from 2601:1c0:8301:b590:f408:d66a:3029:16ad dq2mb54750689ivb\r\n'

现在我们需要开始与服务器对话。是时候创建 i/o(或 o/i)循环了;获取一些用户输入并将其发送到服务器。哎呀!我无法直接发送字符串;这给了我一个类型错误。我需要将消息转换为字节。 stringencode() 方法可以做到这一点(默认编码 utf-8 工作正常)。

只是,当我运行它时——哎呀又来了!当我的消息发送到服务器时没有任何反应。因为我忘记了来自客户端的消息也需要以 rn 结尾。另一个微小的调整给了我们:

import socket
import ssl

hostname = 'pop.gmail.com'
context = ssl.create_default_context()

with socket.create_connection((hostname, 995)) as sock:
    with context.wrap_socket(sock, server_hostname=hostname) as s:
        while true:
            data = s.read(4096)
            msg = input() + "\r\n"


b'+ok gpop ready for requests from 2601:1c0:8301:b590:f408:d66a:3029:16ad g4mb5147337iow\r\n'
user grokprogramming
b'+ok send pass\r\n'
pass trustno1
b'-err [auth] application-specific password required: https://support.google.com/accounts/answer/185833\r\n'

好的,点击该链接后,我将进入一个可以设置应用程序特定密码的页面。我遇到的一个潜在的障碍是:据我所知,您的帐户必须启用双因素身份验证,以便您能够创建应用程序特定的密码。为什么我在我们的 lorde 2024 年开启双因素身份验证?我不能说。我现在知道了。

有了应用程序特定的密码(注意去掉空格),我就可以登录了!然后我将发出 stat 命令,它会告诉我有多少条消息以及它们的总大小。之后,我将发出 list 命令,该命令将返回一个消息列表,其中包含每条消息的 id 和大小。

b'+ok gpop ready for requests from 2601:1c0:8301:b590:f408:d66a:3029:16ad e18mb76868856iow\r\n'
user grokprogramming
b'+ok send pass\r\n'
pass baygdsgkmihkckrb
b'+ok welcome.\r\n'
b'+ok 263 14191565\r\n'
b'+ok 263 messages (14191565 bytes)\r\n1 2778\r\n2 2947\r\n3 6558\r\n4 9864\r\n5 35997\r\n6 45462\r\n7 45462\r\n8 63894\r\n9 11487\r\n10 74936\r\n11 74925\r\n12 11632\r\n13 32392\r\n14 74997\r\n15 51961\r\n16 15375\r\n17 46513\r\n18 21519\r\n19 15966\r\n20 27258\r\n21 28503\r\n22 35615\r\n23 86353\r\n24 280'

我在代码中遇到了一个错误。 list 的响应跨越多行,在这种情况下,将需要多次缓冲区读取。整条消息将以单独一行的句点结束。在这里,我已经收到了一个缓冲区的消息,现在我必须按回车键并向服务器发送一条空白消息,以便代码前进到循环的下一次迭代并再次从缓冲区读取。


import socket
import ssl

hostname = 'pop.gmail.com'
context = ssl.create_default_context()

with socket.create_connection((hostname, 995)) as sock:
    with context.wrap_socket(sock, server_hostname=hostname) as s:
        while true:
            data = s.read(4096)
            while input("more? y/[n]: ") == "y":
                data = s.read(4096)
            msg = input("&gt; ") + "\r\n"


&gt; user grokprogramming
+ok send pass

more? y/[n]: 
&gt; pass trustno1
+ok welcome.

more? y/[n]: 
&gt; stat
+ok 263 14191565

more? y/[n]: 
&gt; list
+ok 263 messages (14191565 bytes)
1 2778
2 2947
3 6558
260 41300
261 114059
262 174321
263 39206

more? y/[n]: 
&gt; retr 1
+ok message follows
mime-version: 1.0
received: by; thu, 28 jun 2012 20:21:50 -0700 (pdt)
date: thu, 28 jun 2012 20:21:50 -0700
message-id: <cadbp03twfokctoak_0p7vv2gb>
subject: customize gmail with colors and themes
from: gmail team <mail-noreply>
to: grok programming <grokprogramming>
content-type: multipart/alternative; boundary=e0cb4e385592f8025004c393f2b4

content-type: text/plain; charset=iso-8859-1
content-transfer-encoding: quoted-printable

to spice up your inbox with colors and themes, check out the themes tab
under settings.
       customize gmail =bb <https:>


- the gmail team
[image: themes thumbnails]

please note that themes are not available if you're using internet explorer
6.0. to take advantage of the latest gmail features, please upgrade to a
fully supported
browser<http: utm_source="3dwel-eml&amp;utm_medium=3deml&amp;utm_campaign=3den">

content-type: text/html; charset=iso-8859-1

more? y/[n]: y

<font face="arial, helvetica, sans-serif">
<p>to spice up your inbox with colors and themes, check out the themes tab
under settings.</p>

<table cellpadding="0" cellspacing="0">
<col style="width: 1px;">
<col style="width: 1px;">
    <td height="1px" style="background-color: #ddd"></td>
<td style="background-color: #ddd"></td>
    <td background="https://mail.google.com/mail/images/welcome-button-background.png" style="background-color: #ddd; background-repeat: repeat-x;
            padding: 10px; font-size: larger">
          <a href="https://mail.google.com/mail/#settings/themes" style="font-weight: bold; color: #000; text-decoration: none;
            display: block;">
      customize gmail »</a>
    <td style="ba
more? y/[n]: y
ckground-color: #ddd"></td>
    <td height="1px" style="background-color: #ddd"></td>

<p>- the gmail team</p>


<p><font size="-2" color="#999">please note that themes are not available if
you're using internet explorer 6.0. to take advantage of the latest gmail
features, please
<a href="http://support.google.com/mail/bin/answer.py?answer=6557&amp;hl=en&amp;utm_source=wel-eml&amp;utm_medium=eml&amp;utm_campaign=en"><font color="#999">
upgrade to a fully supported browser</font></a>.</font></p>



more? y/[n]: 
&gt; quit
+ok farewell.

more? y/[n]: 

又一次巨大的成功!我能够登录 pop3 服务器并检索邮件。当前状态下的脚本非常灵活,但需要用户做大量工作。我将进行一些最后的调整,以使与 pop3 服务器的交互更加容易:如果用户使用“!”开始向服务器发送消息。它会被删除,但脚本将从服务器读取数据,直到它自己到达一行上的句点 - 换句话说,对于具有长响应的命令。不 ”!”脚本将在一行中读取,寻找 rn 字符。

import socket
import ssl

hostname = 'pop.gmail.com'
context = ssl.create_default_context()

def read_until(s, eom):
    # read into the buffer at least once
    data = s.read(4096)
    # continue reading until end of message
    while data[-len(eom):] != eom:
        data += s.read(4096)
    # return incoming bytes decoded to a string
    return data.decode()

def read_single_line(s):
    return read_until(s, b"\r\n")

def read_muli_line(s):
    return read_until(s, b"\r\n.\r\n")

with socket.create_connection((hostname, 995)) as sock:
    with context.wrap_socket(sock, server_hostname=hostname) as s:
        msg = input("&gt; ")
        # empty msg will close connection
        while msg != "":
            if msg[0] == "!":
                msg = msg[1:]
                long = True
                long = False
            msg += "\r\n"
            if long:
            msg = input("&gt; ")
themes thumbnails

