xlxingRun / packet_analysis

使用python实现的数据传输流量分析

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

数据传输流量分析

更新日志

首次提交

目录

内容介绍

使用tcpdump或wireshark抓网络传输报文,格式为pcap,本项目主要对传输数据进行流量分析,统计数据包的传输情况。主要内容:

  • 有效字段提取。主要包含时间,源IP地址,目的IP地址,数据包长度
  • 时间格式化。发包的时间单位是微妙级的,格式化时间以便数据可视化
  • 数据传输可视化。折线图,两种思路(可以作为一个选项):
    • 数据包的发送条目是离散的,画出散点,连接成折线(或者就是散点图)
    • 根据吞吐量计算公式 $吞吐量=\frac{请求总数}{总时长}$,简单来说就是均值化,设定采样区间 $\delta$,可以求任意粒度的吞吐量折线图

立即使用

实现细节

读取数据

pcap为二进制文件,可以使用以下脚本命令生成对应的txt文件(假设需要提取内容的数据包名称为packets.pcap):

tcpdump -r packets.pcp > packets.txt

使用python读取文件,并使用pandas工具,将需要的字段存入到csv文件,对于长度为0的数据包,认为是ack。默认取以下四个字端内容进行流量分析

  • time
  • src_ip
  • dst_ip
  • length

对csv文件进一步格式化

数据可视化

参考内容

使用到的技术

联系作者

Email: xlxling@bupt.edu.cn

About

使用python实现的数据传输流量分析

License:MIT License