Chenfan Blog

Do cool things that matter.


  • Home

  • Archives

  • Categories

  • Tags

  • About

  • Links

  • Paper Reading

  • Search

TensorFlow 拆包(七):Profiling 踩坑 & Benchmark

Posted on 2018-04-10 | Edited on 2018-10-30 | In Project

接上篇:

  • TensorFlow 拆包(一):Session.Run()
  • TensorFlow 拆包(二):TF 的数据流模型实现
  • TensorFlow 拆包(三):Graph 和 Node
  • TensorFlow 拆包(四):Device
  • TensorFlow 拆包(五):Distributed
  • TensorFlow 拆包(六):RDMA

开始分析性能瓶颈了,本篇记录一下研究 TF 中自带的 Profiling 工具时遇到的几个坑点。

Read more »

TensorFlow 拆包(六):RDMA

Posted on 2018-03-12 | Edited on 2018-09-23 | In Project

接上篇:

  • TensorFlow 拆包(一):Session.Run()
  • TensorFlow 拆包(二):TF 的数据流模型实现
  • TensorFlow 拆包(三):Graph 和 Node
  • TensorFlow 拆包(四):Device
  • TensorFlow 拆包(五):Distributed

本篇分析 TensorFlow 1.6.0 中的 RDMA 以及其他的传输优化的实现。

Read more »

TensorFlow 拆包(五):Distributed

Posted on 2018-03-09 | Edited on 2018-09-23 | In Project

接上篇:

  • TensorFlow 拆包(一):Session.Run()
  • TensorFlow 拆包(二):TF 的数据流模型实现
  • TensorFlow 拆包(三):Graph 和 Node
  • TensorFlow 拆包(四):Device

单节点的运行流程基本上已经有个大体印象了,接着就要来拆我所关注的重点所在——分布式运行时了。

Read more »

TensorFlow 拆包(四):Device

Posted on 2018-03-07 | Edited on 2018-09-23 | In Project

接上篇:

  • TensorFlow 拆包(一):Session.Run()
  • TensorFlow 拆包(二):TF 的数据流模型实现
  • TensorFlow 拆包(三):Graph 和 Node

这篇要分析的是 TensorFlow 中跟计算设备相关的内容。

Read more »

TensorFlow 拆包(三):Graph 和 Node

Posted on 2018-02-28 | Edited on 2018-09-23 | In Project

接上篇:

  • TensorFlow 拆包(一):Session.Run()
  • TensorFlow 拆包(二):TF 的数据流模型实现

先来拆一下第一篇里面 DirectSession::Run 里面跑的那个 graph 里面到底都是些什么内容。

Read more »

Intel 处理器架构演进

Posted on 2018-02-13 | Edited on 2018-09-23 | In Computer Architecture

刚刚把《硬/软件接口》重新过完了一遍,觉得对微处理器中间的结构有点意犹未尽,真的是很有趣啊,然鹅翻开《量化分析方法》的目录看了看,又吓得我把书扔回去了……内容略多,留着慢慢看吧。

其实 Intel 历年处理器架构演变这事老早我就很好奇了,尤其在 SC17 上今年我们摸过的 Xeon Platinum 8176 那一代 CPU 性能比上代 E5-269x 暴涨了一大截,更是让人好奇这里面有些什么变化。

所以准备来理一理 Intel 处理器架构的演进史。

Read more »

计算机组成与设计.硬件/软件接口 学习笔记(三)

Posted on 2018-02-12 | Edited on 2018-09-23 | In Computer Architecture

接上篇:

  • 计算机组成与设计.硬件/软件接口 学习笔记(一)
  • 计算机组成与设计.硬件/软件接口 学习笔记(二)

本篇为第六章的内容。

Read more »

计算机组成与设计.硬件/软件接口 学习笔记(二)

Posted on 2018-02-06 | Edited on 2018-09-23 | In Computer Architecture

重新理了一下,把内容分开,其实大部分内容都是以前记的,接上篇:

  • 计算机组成与设计.硬件/软件接口 学习笔记(一)

本篇为第四、五章开始。

Read more »

TensorFlow 拆包(二):TF 的数据流模型实现以及自动求导

Posted on 2018-01-23 | Edited on 2018-11-09 | In Project

接上篇:

  • TensorFlow 拆包(一):Session.Run()

写着写着越写越多了,所以想想还是分成多篇来了,要不一页内容有点多。

Control Flow in TF

从 Executor 的运行实现里面往下继续的时候遇到了点问题,代码里面有个叫 Frame 的概念,但是注释里面很多东西都写的不清不楚的,不知道在干吗,于是在网上找了点关于 TF 的整个控制流方面的资料:

  • Request for documentation: Loop implementation - GitHub
  • Implementation of Control Flow in TensorFlow

核心的问题是从 TensorFlow 的循环控制里面引出来的,这块内容具体涉及到的也其实就是 TensorFlow 中的数据流模型的实现了,这里的数据流模型原型是基于 Jack Dennis 和 Arvind 等人所提出的数据流机。

Read more »

写了一个画框图的轮子

Posted on 2018-01-18 | Edited on 2018-10-04 | In Project

这事的起因是想给前面那篇 TF 拆包画个函数调用图,然后试了若干画图工具都不是很满意,最后准备试试看能不能造个轮子出来。

Electron 上手还是很容易的,即使对我这样前端基础甚少的第一次写这种项目的人,找了个别人做的网页实现照着做,也只花了一个下午就写出来一个初版了。

Read more »
123…16
Jcf94

Jcf94

To live is to change the world.

156 posts
19 categories
164 tags
RSS
GitHub Weibo Zhihu Linked-in
Creative Commons
© 2014 – 2019 Jcf94
Powered by Hexo v3.8.0
|
Theme – NexT.Gemini v6.4.2
0%