traceless / tlf-encryption

一个简单的流加密算法-TLF,可以用在对加密要求不高的地方,有一些场景是可以使用的。R4C的方案固然是更好的,但是实际使用起来会比较复杂一些。这个加密对实时流解密比较方便一些。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

TLF-encryption

flow-encryption 一个简单的流加密算法,可以用在对加密要求不高的地方,有一些场景还是非常适合的。R4C 的算法方案固然是更好的,但是实现和使用起来会比较复杂一些,对业务代码的耦合比较强。这个加密实现简单,可以直接代理中间的流量。

这个算法的应用已经迁移到迁仓库,https://github.com/traceless/alist-encrypt RC4算法目前也加入到此项应用中,也是支持RC4方式加密,安全性更好。播放跳转的时候会慢一些(后续会优化掉),但不影响正常使用。

一、实现的思路

1、关于流加密的算法有很多,基本原理都是对字节进行异或运算,最简单的一个流加密实现就是一个固定的字节,比如 11001100 和每个字节进行异或运算,但是这样的方式就很容易被别人破解。

2、那么我们可以简单的准备一组加密的字节,比如 11001100,10001000,10011001...,如果明文的字节为 10001000,那么它对应的 encode 加密字节就为 11001100,以此类推,所以我们要准备一个明文和加密 byte 的映射

3、假设我们随机生成 16 个加密的字节(暂用 int 整型来标识) encode: [161 65 196 121 39 146 155 194 209 251 110 51 103 33 96 240] ,明文的后四位(0-15)就是对应 ecode 的数组的index位置。比如明文 xxxx0001,那么它对应就是 ecode[1],如 xxxx0011 -> encode[3],以此类推,所有的明文都可以找到对应的 ecode byte。

我们可以得到明文和加密 encode 数组的映射:

明文 byte xxxx0000 xxxx0001 xxxx0010 xxxx0011 xxxx0100 ...
加密 byte 10100001 01000001 11000100 01111001 00100111 ...
加密后 byte xxxx0001 xxxx0000 xxxx0110 xxxx1010 xxxx0011 ...
密文后四位 1 0 6 10 3 ...

从上面可以得出加密后的密文的规则,比如密文等于 xxxx0001,那么它对应的 encode 加密字节就是 10100001,如:xxxx0011 -> 00100111,按照这方式进行解密即可。但是密文后四位会有冲突,很可能都会出现 xxxx0010 ^ 11000100(encode) = 6,xxxx0100 ^ 11110010(encode) = 6 ,只要找一个没有被占用的数字比如 2,然后修改 ecode byte使得密文后四位等于 1111 0110 就可以了。

ecode 的数组生成我们可以使用 MD5 的方式进行创建,然后再生成 decode 的数组,当然解决取模冲突后,原本 encode 也会发生变化,具体看代码实现。

二、算法的优缺点

  • 缺点:这个算法实现比较简单,破解的难度我也不好去验证,毕竟是固定的密码,通过某些流数据特征还是比较容易破解的(比如 class 文件开头的四个字节是固定的 0x CAFEBABE)。如果是单纯的暴力破解目前还是没什么机会的。另外可以根据原文件就能得到 encode 和 decode,这个解决的方案在算法优化有提到。

  • 优点:算法很简单,可以嵌入到很多代理的中间件中,对流的加密不用入侵到业务代码中,可透传加解密,没有中间停留的过程。另外文件解密只要给对方 encode\decode 就可以了。

三、算法的优化方向

1、因为上面的是固定加密 encode,如果 encode 泄露了,那么其他的已经加密的数据也会出现问题。那么我们也可以通过流的某些属性或特征作为 MD5 的 salt,这样每次生成的密码本也会不一样。比如传输的是文件,那么文件流的长度是比较容易获取到的,可以作为 md5 的 salt。

2、目前采用的是 16 个字节,如果要换成 32 个字节,那么可能破解的难度是否增加?这个我没有去研究,毕竟 16 个字节破解的难度已经很大了,粗算大于 1.8x10^19 * 10^N(N不知道有多大,保守大于8)。

四、其他流算法

1、流密码算法有 RC4、A5/1、ZUC 等,它们的实现可能会更加安全,也可以用业内一些成熟的方案。不过还是要根据实际业务需求来使用,这些算法也许并不能满足业务需求。

五、应用场景

1、http 代理思路

因为考虑到 webdav 是基于 http 协议的,那么理论上完成 http 代理的实现就包含了 webdav 的实现了。由于只拦截 body 进行加解密,所以请求头 headers 和响应头 headers 就不需要动了,基本就是原路透传。

实现的思路:

  1. 解析请求头 headers,然后传到 webdav 服务器中,请求的 body 按业务进行是否加密。
  2. 解析响应头 headers,并原路返回到客户端中,响应的 body 按业务判断进行是否解密。

其他语言就可以根据这样的思路进行分析和拦截,node.js 提供的 http 模块非常的方便实现这样的业务。

2、http 代理的实现

1、httpProxy.js 是一个 http 代理服务器的最基础的实现,里面有对 http 的 body 流进行拦截加解密,可用于学习和参考。不得称赞一下 node.js 所提供 http 模块的实现,直接提供了 body 的读写流,还有 Transform 转换流接口,开发起来扛扛的。换其他语言,估计折腾大半天。

2、app.js 是一个 http 代理服务器的基本实现,可以针对性对 webdav 的流量进行挟持,使用流加密的方式可以对上传的文件,下载的文件进行加解密。也可以对一些在线视频播放的流进行实时解密。目前只代理了/dav/*的路径用于测试和验证,也可以改成代理整个 alist。

3、目前给出的 ndoejs 的 demo 版本,测试阿里云盘的上传,删除,移动,下载(302 已解决)都可以正常使用,也能正常加密和解密。配置文件参考下 config.js。

六、后续算法应用

这个项目的应用已经迁移到迁仓库,https://github.com/traceless/alist-encrypt

About

一个简单的流加密算法-TLF,可以用在对加密要求不高的地方,有一些场景是可以使用的。R4C的方案固然是更好的,但是实际使用起来会比较复杂一些。这个加密对实时流解密比较方便一些。


Languages

Language:JavaScript 65.3%Language:Java 27.1%Language:Go 7.6%