<div dir="ltr"><div> >I'd be more worried about usability and what problem it's actually solving.<br><br>Forget about encryption and think people.<br><br>Magic, wondrous email enables<br>anybody - worldwide - to email you!<br><br>Let's divide all the people on planet<br>earth into three sets:<br><br>{1} people you know;<br><br>{2} people you don't know but who know [something about] you<br>which makes them think that you would be interested in getting<br>to know them/talk to them about something of mutual interest;<br><br>{3} people who don't know you -> some of these write botnets<br>that spam you because of an x% chance to make some money.<br><br>For most of us, the cardinality of sets {1} and {2}<br>is small enough that we _want_ to _see_ all email messages<br>sent by people in {1} and {2}. We might not want to _reply_<br>to messages in {2}, but we want to read them to decide.<br><br>(For the Paul Grahams of this world where this is not true,<br>there is no solution but to pay for extra eyeballs to help<br>process their email stream.)<br><br>Unfortunately, for all of us, most emails received are from {3}.<br>This is the least important stuff (or if it is a notification<br>from a shop you just bought from the first time, you will know<br>to go and look for it the minute after you purchased or when<br>you need it).<br><br>A good email client must be able to divide received<br>emails into {1}, {2} and {3} because emails from {3}<br>dominate and would otherwise visually obscure the<br>good stuff. Also note that anything in {2} cannot be<br>auto-replied-to by the email client, you have to read<br>and evaluate the pitch yourself.<br><br>I don't think this is easy to do:<br><br>{1} is nearly trivial,<br>but distinguishing between {2} and {3} is very hard<br>(if you think that is what current ESP spam filters do,<br>simply pretend you are solving for the "first email contact<br>with new email address should already be e2e encrypted" case<br>where you cannot rely on ESP help).<br><br>Unfortunately is is essential from a "delight the user"<br>point of view to distinguish between {2} and {3} because<br>emails from {3} fully dominate emails from {2}, and it<br>is very undelightful to have to filter them out oneself.<br><br>==> Usecase (the problem it is trying to solve):<br><br>1. The [politely] protocol is meant to trivially help your email<br>client distinguish between {2} and {3} (ideally even without<br>the help of your ESP's spam filter if for example you run </div><div>it over an encrypted channel).<br><br>2. Since only you can be the final judge of whether a<br>"pitch for attention" is valid or not, the protocol is<br>further designed (text-only one-paragraph) to help you<br>process these pitches as quickly as possible (in case<br>you are a half-graham and get loads of them, or in case<br>some people in {3} abuse it):<br><br>-> a twitter-like stream of short one-paragraph pitches does<br>not take long to skimread/scroll through (and it is ok<br>to not reply, people in {2} know they might have to and<br>are allowed to retry again later).<br><br>3. The protocol must successfully discourage abuse by<br>99.999007% of people in {3} or we are back to commingled<br>{2} and {3}. (Getting there without ESP help might be tricky.)<br><br>So the protocol is orthogonal to encryption.<br>It's just that<br>if you only want to accept encrypted email from {1}<br>then you need a "safe and delightful enough" way to process<br>emails from {2} and decide which ones are allowed into {1}<br><br><br>Encryption:<br>------------------------------------------------------------<br><br>For now just two observations:<br><br>1. Usefulness/Sacrifice of a cleartext opening message:<br><br>a. If it is a politely handshake ({2}),<br>it is only a pitch for attention written to convince you<br>that the person is indeed in {2}, ie mainly that he knows<br>(sth about) you. The real-life equivalent: at a conference,<br>with lots of people around overhearing you, you approach the<br>speaker and ask him if you could talk about your secret<br>idea  directly relevant to his field of expertise somewhere<br>quiet.<br><br>b. If it is another email in {3} which you choose to reply<br>to (and for some reason the sender is e2e enabled but did<br>not use the politely protocol): better now than never.<br><br>c. All your current conversations with your friends {1} are<br>probably in the clear at your ESP. This is worse than just a<br>first message, yet I guess you would still switch to e2e encrypted<br>with them asap?<br><br>2. Metadata in the clear:<br><br>Here's my pessimistic threat model:<br><br>- a big brother active(*) global adversary,<br>- interested in eavesdropping and metadata (who with whom when),<br>- everything that goes over the wire is monitored in realtime,<br>- and persisted somewhere (for eventual later use).<br><br>(*) "active" only as needed to hide MITM attacks, not<br>to impersonate or semantically modify content, the<br>aim is "undetected passive listening in" and<br>"network analysis".<br><br>In this model I just assume the adversary knows/can infer<br>the metadata, whether I encrypt it or not (TOR is assumed<br>crackable in my model). In case it isn't obvious,<br>IANAC (I am not a cryptographer), so simplifying<br>to pessimist.<br><br>I also assume that a real solution which enables secure<br>_anonymous_ communication [over email] with this kind of adversary<br>is not going to be deployed (to millions of users) anytime soon.<br><br>So for now: big brother does have the metadata (who with whom when).</div></div>