一、零拷贝基本介绍
1、零拷贝是网络编程的关键,很多性能优化都离不开。
2、在Java程序中,常用的零拷贝有mmap(内存映射)和sendFile。在OS里,他们是怎样的一个设计?
3、NIO中如何使用零拷贝。
二、传统IO数据读写
1、Java传统IO和网络编程的一段代码
File file = new File("test.txt");
RandomAccessFile raf = new RandomAccessFile(file, "rw");
byte[] arr = new byte[(int)file.length()];
//把文件数据读入到字节数组中
raf.read(arr);
Socket socket = new ServerSocket(8080).accept();
socket.getOutputStream().write(arr);
2、DMA
direct memory access,直接内存拷贝(不使用CPU)
传统IO:
Hard drive -> kernal buffer -> user buffer -> socket buffer -> protocol engine
经过了4次拷贝,3次切换。
3、mmap优化
mmap通过内存映射,将文件映射到内核缓冲区,同时,用户空间可以共享内核空间的数据。这样在进行网络传输时,就可以减少内核空间到用户空间的拷贝次数。
4、sendFile优化
Linux2.1版本提供了sendFile函数,其基本原理如下:数据根本不经过用户态,直接从内核缓冲区进入到Socket Buffer,同时,由于和用户态完全无关,就减少了一次上下文切换。
5、我们说的零拷贝是从操作系统的角度看的,是没有cpu拷贝。
三、零拷贝再次理解
1、我们说零拷贝,是从操作系统的角度来说的。因为内核缓冲区之间,没有数据是重复的(只有kernel buffer有一份数据)。
2、零拷贝不仅仅带来更少的数据复制,还能带来其他的性能优势,例如更少的上下文切换,更少的CPU缓存伪共享以及无CPU校验和计算。
四、mmap和sendFile的区别
1、mmap适合小数据量读写,sendFile适合大文件传输。
2、mmap需要4次上下文切换,3次数据拷贝;sendFile需要3次上下文切换,最少2次数据拷贝。
3、sendFile可以利用DMA方式,减少CPU拷贝,mmap则不能(必须从内核拷贝到socket缓冲区)。