豌豆

1 引子

同事写的程序出现了点问题。调试发现，错误出现在一个 if 语句上：

// ...
// float a = 0.2, b=0.4;
if(a + b == 0.6)
// ...

1

2

3

4

// ...

// float a = 0.2, b=0.4;

if(a + b == 0.6)

// ...

这个 if 表达式被判定为 false, 程序没有按照预订执行下去。0.2 + 0.4 = 0.6,这还会有错吗？同事表示其小学数学还是很过关的。是的，在人类的认知里，这毫无疑问是正确的，但是在计算机的认知里，就不一定了。这需要我们了解浮点数这种数据类型。

2 浮点数

2.1 用二进制表示小数

首先我们来想一下如何来表示一个十进制整数 d：

$$ d_m d_{m-1} ... d_1 d_0 d_{-1} d_{-2} ... d_{-1}, d\in [0,9] $$

这个表示方法描述的数值 d 的定义如下：

$$ d = \sum_{i=-1}^m{10^i \times d_i} $$

同样，引申到小数，小数点左边的数字是 10 的非负幂，得到整数部分;小数点右面的数字是 10 的负幂，得到小数部分。

例如： $12.34_{10}$ 所表示的字为: $ 1 \times 10^{1} + 2 \times 10^{0} + 3 \times 10^{-1}
+ 4 \times 10^{-2} =12 \frac{34}{100} $

类似地我们考虑一个二进制数 b 的表示：

$$ b_{m} b_{m-1} ... b_{1} b_{0} b_{-1} ... b_{-n} ,b\in[0,1] $$

它的定义如下：
$$ b = \sum_{i=-n}^{m}2^i \times d_i $$

如 $10.11_2$ 表示数字: $1 \times 2^1 + 1 \times 2^{0} + 1 \times 2^{-1} + 1 \times 2^{-2} = 2 \frac{3}{4} $

继续阅读

Note

1 概述

python 为脚本自动化操作 Word 提供了可能。最为常用是 python-docx .使用它可以方便地创建或更新 Microfoft Word(.docx) files.

下图是其官网给出的一个使用 python-docx 创建的 word 文档的 Demo:

文档地址：http://python-docx.readthedocs.io/en/latest/index.html

github: https://github.com/python-openxml/python-docx
这是官网给出的代码：

from docx import Document
from docx.shared import Inches

document = Document()

document.add_heading('Document Title', 0)

p = document.add_paragraph('A plain paragraph having some ')
p.add_run('bold').bold = True
p.add_run(' and some ')
p.add_run('italic.').italic = True

document.add_heading('Heading, level 1', level=1)
document.add_paragraph('Intense quote', style='IntenseQuote')

document.add_paragraph(
    'first item in unordered list', style='ListBullet'
)
document.add_paragraph(
    'first item in ordered list', style='ListNumber'
)

document.add_picture('monty-truth.png', width=Inches(1.25))

table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Qty'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
for item in recordset:
    row_cells = table.add_row().cells
    row_cells[0].text = str(item.qty)
    row_cells[1].text = str(item.id)
    row_cells[2].text = item.desc

document.add_page_break()

document.save('demo.docx')

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

from docx import Document

from docx.shared import Inches

document = Document()

document.add_heading('Document Title', 0)

p = document.add_paragraph('A plain paragraph having some ')

p.add_run('bold').bold = True

p.add_run(' and some ')

p.add_run('italic.').italic = True

document.add_heading('Heading, level 1', level=1)

document.add_paragraph('Intense quote', style='IntenseQuote')

document.add_paragraph(

'first item in unordered list', style='ListBullet'

)

document.add_paragraph(

'first item in ordered list', style='ListNumber'

)

document.add_picture('monty-truth.png', width=Inches(1.25))

table = document.add_table(rows=1, cols=3)

hdr_cells = table.rows[0].cells

hdr_cells[0].text = 'Qty'

hdr_cells[1].text = 'Id'

hdr_cells[2].text = 'Desc'

for item in recordset:

row_cells = table.add_row().cells

row_cells[0].text = str(item.qty)

row_cells[1].text = str(item.id)

row_cells[2].text = item.desc

document.add_page_break()

document.save('demo.docx')

2 安装 python-docx

可以使用 pip 或 easy_install 来进行安装

pip install python-docx

或

easy_install python-docx

1

2

3

4

5

pip install python-docx

或

easy_install python-docx

也可以直接下载安装文件来进行安装：

tar xvzf python-docx-{version}.tar.gz
cd python-docx-{version}
python setup.py install

1

2

3

tar xvzf python-docx-{version}.tar.gz

cd python-docx-{version}

python setup.py install

要求Python 版本在2.6 以上或 3.3 以上，lxml 版本在 2.3.2及以上。在 Windows 10 / Python 2.7 环境下安装时出现 lxml3.7.2 安装失败的问题，可降低版本进行尝试：

pip install lxml==3.4.2

1	pip install lxml==3.4.2

3 快速上手

3.1 打开文档

from docx import Document
document = Document()

1 2	from docx import Document document = Document()

新建一个空的 word 文档。当然，也可以打开一个已存在的 word 文档，只要传入相应的路径就好。

3.2 添加段落

继续阅读

Note python

python 学习笔记 — python的类

2016/12/03 6,409

1 创建类

使用 class 关键字来创建一个类。

class ClassName:
        '类的注释'
        class_suite     #类体

1

2

3

class ClassName:

'类的注释'

class_suite #类体

类的注释可由 ClassName.__doc__ 来查看。class_suite 由类的成员、方法、属性组成

实例

#-*- coding:utf-8 -*-
class Student:
        '学生'
        def __init__(self, name,sex,num):
                self.name = name
                self.sex = sex
                self.num = num

        def displayInfo(self):
                print "Name:",self.name,",Sex:",self.sex,",Num:",self.num

        def __del__(sefl):
                class_name = self.__class__.__name__
                print class_name,'Deleted'

1

2

3

4

5

6

7

8

9

10

11

12

13

14

#-*- coding:utf-8 -*-

class Student:

'学生'

def __init__(self, name,sex,num):

self.name = name

self.sex = sex

self.num = num

def displayInfo(self):

print "Name:",self.name,",Sex:",self.sex,",Num:",self.num

def __del__(sefl):

class_name = self.__class__.__name__

print class_name,'Deleted'

__init__() 可以看作是类的构造函数。(其实类的构造函数是 __new__ ，它是一个类方法，在类的实例初始化之前调用。__init__ 实际是类的初始化函数)
self 代表类的实例，类的方法必须有一个额外的形参，按惯例它的名称为self,但在调用时不必传入该参数。
__del__() 是类的析构函数，在对象被销毁的时候调用。

2 类的实例

要创建一个类的实例，可以调用该一特殊的函数来完成。该函数的名称为类的名称，参数为该类的 __init__()的参数。

>>> from Student import Student
>>> s = Student('A',1,1)
>>> s.displayInfo()
Name: A ,Sex: 1 ,Num: 1
>>> print s.name  #属性
A
>>> print s.__doc__
学生
>>> print Student.__doc__
学生

1

2

3

4

5

6

7

8

9

10

>>> from Student import Student

>>> s = Student('A',1,1)

>>> s.displayInfo()

Name: A ,Sex: 1 ,Num: 1

>>> print s.name #属性

A

>>> print s.__doc__

学生

>>> print Student.__doc__

学生

还可以使用下列函数来访问属性：

getattr(obj,name[,default]) 访问对象的属性
hasattr(obj,name) 检查是否存在一个属性
setattr(obj,name,value) 设置一个改改。如果不存在，则创建之
delattr(obj,name) 删除一个属性

继续阅读

Note python

libcurl 是一个免费开源的 客户端 的网络传输库，它支持多种协议，包括
DICT, FILE, FTP, FTPS, Gopher, HTTP, HTTPS, IMAP, IMAPS, LDAP, LDAPS, POP3, POP3S, RTMP, RTSP, SCP, SFTP, SMTP, SMTPS, Telnet and TFTP等，还支持 SSL 认证。它简单好用，用它自己的话来说，就是 free, thread-safe, IPv6 compatible, feature rich, well supported, fast, thoroughly documented and is already used by many known, big and successful companies and
numerous applications。

1 基本流程

使用 libcurl 的一般流程：

curl_global_init() 进行库的初始化
curl_easy_init() 获取CURL* 指针
curl_easy_setopt() 设置传输参数，包括回调等
curl_easy_perform() 完成传输
curl_easy_cleanup() 释放内存
curl_global_cleanup() 释放库内存

我们需要着重关心的，是第 3 步。在这一步里，我们将指定 libcurl 如何将参数传递给服务端。

1.1 简单示例

#include <iostream>
#include "curl/curl.h"

using namespace std;

size_t read_callback(char *buffer, size_t size, size_t nitems, void *instream) 
{
        cout << buffer << endl;
        return size * nitems;
}

int main(void) 
{

        curl_global_init(CURL_GLOBAL_ALL);
        CURL* handle = curl_easy_init();
        if (!handle)
        {
                cout << "curl_easy_init error" << endl;
        }

        struct curl_slist* headers = NULL;
        curl_slist_append(headers, "user-agent:Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) \
                                                Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0");
        curl_slist_append(headers, "accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8");

        curl_easy_setopt(handle, CURLOPT_URL, "http://curl.haxx.se/");
        curl_easy_setopt(handle, CURLOPT_HEADER, 1L);
        curl_easy_setopt(handle, CURLOPT_HTTPHEADER, headers);
        curl_easy_setopt(handle, CURLOPT_READFUNCTION, read_callback);

        CURLcode status = curl_easy_perform(handle);
        if (status != CURLE_OK) 
        {
                cout << "curl_easy_perform Error:" << status << endl;
        }
        curl_easy_cleanup(handle);

        curl_global_cleanup();

        return 0;
}

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

#include <iostream>

#include "curl/curl.h"

using namespace std;

size_t read_callback(char *buffer, size_t size, size_t nitems, void *instream)

{

cout << buffer << endl;

return size * nitems;

}

int main(void)

{

curl_global_init(CURL_GLOBAL_ALL);

CURL* handle = curl_easy_init();

if (!handle)

{

cout << "curl_easy_init error" << endl;

}

struct curl_slist* headers = NULL;

curl_slist_append(headers, "user-agent:Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) \

Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0");

curl_slist_append(headers, "accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8");

curl_easy_setopt(handle, CURLOPT_URL, "http://curl.haxx.se/");

curl_easy_setopt(handle, CURLOPT_HEADER, 1L);

curl_easy_setopt(handle, CURLOPT_HTTPHEADER, headers);

curl_easy_setopt(handle, CURLOPT_READFUNCTION, read_callback);

CURLcode status = curl_easy_perform(handle);

if (status != CURLE_OK)

{

cout << "curl_easy_perform Error:" << status << endl;

}

curl_easy_cleanup(handle);

curl_global_cleanup();

return 0;

}

2 curl_easy API 介绍

继续阅读

Note curl, libcurl

树莓派(Debian)配置 DNS 服务

2016/11/14 7,731

流程：

安装 bind9
配置 domain.zone
配置 named.conf
检查配置
启动服务

安装 bind9

apt-get install bind9

1	apt-get install bind9

非 root 用户请注意使用 sudo

配置domain.zone

选任意一个地方新建一个文件，文件名可以为 domain.zone (如 wandoer.com.zone).该文件会被named.conf 引用。由于 named.conf位于 /etc/bind/ 路径下，为了方便管理，这里在此路径下建立文件夹 zones/ 来管理zone 文件

这里给出 wandoer.com.zone 的示例：

$TTL    604800

@   IN  SOA  localhost. root.localhost. (
    2       ; Serial
    604800  ; Refresh
    86400   ; Retry
    2419200 ; Expire
    604800  ; Minimum  
)

$ORIGIN wandoer.com.

@       IN  NS localhost. ;
about     IN  A  118.186.246.46   ;   
photo     IN  A  118.186.246.46   ;

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

$TTL 604800

@ IN SOA localhost. root.localhost. (

2 ; Serial

604800 ; Refresh

86400 ; Retry

2419200 ; Expire

604800 ; Minimum

)

$ORIGIN wandoer.com.

@ IN NS localhost. ;

about IN A 118.186.246.46 ;

photo IN A 118.186.246.46 ;

配置 named.conf

在 /etc/bind/ 路径下有几个 named.conf.* 文件，这里选 named.conf.default-zones 文件进行配置.打开文件，在最后加入以下几行：

zone "wandoer.com" {
    type master;
    file "/etc/bind/zones/wandoer.com.zone";
    allow-update { none; };
};

1

2

3

4

5

zone "wandoer.com" {

type master;

file "/etc/bind/zones/wandoer.com.zone";

allow-update { none; };

};

检查配置

 named-checkzone  wandoer.com  /etc/bind/zones/wandoer.com.zone

1	named-checkzone wandoer.com /etc/bind/zones/wandoer.com.zone

如果配置无误，则会显示 OK .否则配置提示进行修正。

启动服务

service bind9 start

1	service bind9 start

bind 默认将日志放在 /var/log/syslog 中。如果服务启动失败，则可以查看该日志查找原因。

验证DNS

打开 /etc/resolv.conf ,在第一个 nameserver 前再添加一个 nameserver,指向树莓派本机IP：

namedserver  192.168.1.100

1	namedserver 192.168.1.100

然后 ping wandoer.com 查看是否已经将此域名解析到指定的IP.

Note

TCP/IP中write/read的行为

2016/10/12 7,977

read/write 为什么会被阻塞

首先应该知道的是，当write成功返回时，只是将buf中的数据复制到了缓冲区，至于数据什么时候被发往网络，什么时候被对方主机接收，什么时候被对方进程读取，系统调用层面不会给予任何保证和通知。
当kernel的该socket的发送缓冲区已满时，write就会被阻塞。每个socket都拥有自己的send buffer和receive buffer，其大小由系统自动调节。

#include <unistd.h>
ssize_t write(int fd, const void *buf, size_t count);

1 2	#include <unistd.h> ssize_t write(int fd, const void *buf, size_t count);

已经发送到网络的数据依然需会在send buffer中暂存，只有当收到对方的ack后，kernel才从buffer中将这一部分清除。接收端将收到的数据暂存在receive buffer中，自动进行确认。但如果socket所在的进程来不及时将数据从receive buffer中取出，最终导致receive buffer填满，由于TCP的滑动窗口和拥塞控制，接收端会阻止发送端向其发送数据。这些控制皆发生在TCP/IP栈中，对应用程序是透明的，应用程序继续发送数据，最终导致send buffer填满，write调用阻塞。
一般来说，由于接收端进程从socket读数据的速度跟不上发送端进程向socket写数据的速度，最终导致发送端write调用阻塞。
而read调用的行为则相对容易理解，从socket的receive buffer中拷贝数据到应用程序的buffer中。read调用阻塞，通常是发送端的数据没有到达。继续阅读

Note TCP, 网络

无效的 UTF-8 字符串在移动端引发的问题

2016/09/27 12,267

C++ 返回的 char* 字符串(utf-8)中，夹杂了一些无效的字符，在移动端引发了一些问题。表现为：在 Android 端，引发了 JNI 异常：

env->NewStringUTF(data):

JNI DETECTED ERROR IN APPLICATION: input is not valid Modified UTF-8: illegal continuation byte 0xe6

而在 iOS 端，则为

[NSString stringWithUTF8String:data]

的返回值为 nil

在 Android 端，这个BUG有人向 google 提交了 issue,暂还没有得在解决。目前的解决办法是多做一步转换，先将 char* 转为 JByteArray,再转成jString：

//int size, char* data
jbyteArray array = (*env)->NewByteArray(env, size);
(*env)->SetByteArrayRegion(env, array, 0, size, data);
jstring strEncode = (*env)->NewStringUTF(env, "UTF-8");
jclass cls = (*env)->FindClass(env, "java/lang/String");
jmethodID ctor = (*env)->GetMethodID(env, cls, "<init>", "([BLjava/lang/String;)V");
jstring object = (jstring) (*env)->NewObject(env, cls, ctor, array, strEncode);

1

2

3

4

5

6

7

//int size, char* data

jbyteArray array = (*env)->NewByteArray(env, size);

(*env)->SetByteArrayRegion(env, array, 0, size, data);

jstring strEncode = (*env)->NewStringUTF(env, "UTF-8");

jclass cls = (*env)->FindClass(env, "java/lang/String");

jmethodID ctor = (*env)->GetMethodID(env, cls, "<init>", "([BLjava/lang/String;)V");

jstring object = (jstring) (*env)->NewObject(env, cls, ctor, array, strEncode);

而在 iOS端，则可以使用 libiconv 将 UTF-8 字符串转为 GBK,再转为 UTF-8 字符串，转换时，使用 "//IGNORE" 选项忽略无效的字符，即可。

Note

函数调用约定(stdcall cdecl thiscall fastcall)

2016/08/31 7,724

引子

一位朋友在使用函数指针时出现了一个错误：这个函数指针 FP 要求有 4 个参数，而他将一个只有 3 个参数的函数作为 FP 使用,编译和运行都没有报错，但这样造成的运行结果可能是不正确的。下面一个例子来重现这个问题:

typedef int(*FunPt)(int a, int b, int c, int d);

int add(int a, int b, int c)
{
	return a + b + c;
}

int main()
{
	cout << ((FunPt)(add))(1, 2, 3, 4) << endl;

	return 0;
}

1

2

3

4

5

6

7

8

9

10

11

12

13

typedef int(*FunPt)(int a, int b, int c, int d);

int add(int a, int b, int c)

{

return a + b + c;

}

int main()

{

cout << ((FunPt)(add))(1, 2, 3, 4) << endl;

return 0;

}

如上例，这两个函数的签名不同。 FunPt 要求 4 个参数，而函数 add 只有 3 个参数。虽然在编译和运行时都没有报错，但毫无疑问，返回的结果是错误的。为什么会出现这样的错误呢，这要从函数的调用约定说起。

__cdecl 调用约定

从 C 语言时代开始就有了这个调用约定。它又称 C调用约定，是 C 程序默认的调用约定(现在也是 C++ 程序默认的调用约定)。在这种约定下，函数参数从右向左入栈，函数堆栈由调用者清理，所以它允许函数参数的个数不确定，且它生成的可执行文件大小会比 __stdcall 函数大。
按C编译方式，_cdecl调用约定仅在输出函数名前面加下划线，形如_functionname。

__stacall 调用约定

它是 Pascal 程序的默认调用方式，所以又称 Pascal 调用约定。和 __decel 一样，参数是从右到左入栈的方式，不同的是堆栈将由被调用函数来清理。
按C编译方式，_stdcall调用约定在输出函数名前面加下划线，后面加“@”符号和参数的字节数

__fastcall 调用约定

它通 CPU 寄存器传递参数，所以调用较快。这也是为什么叫 "fastcall" 的原因。
按C编译方式，_fastcall调用约定在输出函数名前面加“@”符号，后面加“@”符号和参数的字节数

__thiscall 调用约定

它是 C++ 成员函数是默认调用约定。由于成员函数调用还有一个this指针，因此必须特殊处理。如果参数个数确定，this指针通过ecx传递给被调用者，函数自身清理栈；如果参数个数不确定，this指针在所有参数压栈后被压入堆栈，由调用者清理栈。它的参数也是从右向左入栈的。

比较

下面来比较 cdecl 和 stdcall 两种方式的代码：

#include <iostream>
using namespace std;

int __cdecl cAdd(int a, int b)
{
	return a + b;
}

int __stdcall sAdd(int a, int b)
{
	return a + b;
}

int main(void)
{
	int s1 = cAdd(1, 2);
	int s2 = sAdd(3, 4);
	return 0;
}

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

#include <iostream>

using namespace std;

int __cdecl cAdd(int a, int b)

{

return a + b;

}

int __stdcall sAdd(int a, int b)

{

return a + b;

}

int main(void)

{

int s1 = cAdd(1, 2);

int s2 = sAdd(3, 4);

return 0;

}

借助 Visual Studio ,我们查看汇编代码：

int main(void)
{
//...... 
	int s1 = cAdd(1, 2);
00FA17BE  push        2  
00FA17C0  push        1  
00FA17C2  call        cAdd (0FA1154h)  
00FA17C7  add         esp,8  ;清理栈
00FA17CA  mov         dword ptr [s1],eax  
	int s2 = sAdd(3, 4);
00FA17CD  push        4  
00FA17CF  push        3  
00FA17D1  call        sAdd (0FA1316h)  
00FA17D6  mov         dword ptr [s2],eax  
	return 0;
00FA17D9  xor         eax,eax  
}

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

int main(void)

{

//......

int s1 = cAdd(1, 2);

00FA17BE push 2

00FA17C0 push 1

00FA17C2 call cAdd (0FA1154h)

00FA17C7 add esp,8 ;清理栈

00FA17CA mov dword ptr [s1],eax

int s2 = sAdd(3, 4);

00FA17CD push 4

00FA17CF push 3

00FA17D1 call sAdd (0FA1316h)

00FA17D6 mov dword ptr [s2],eax

return 0;

00FA17D9 xor eax,eax

}

可以看出：main 在调用由 __cdecl 标记的 cAdd 函数后，清理了栈，而调用由 __stdcall标记的 sAdd 函数后，并没有清理栈。

Note

存档

1 引子

2 浮点数

2.1 用二进制表示小数

1 概述

2 安装 python-docx

3 快速上手

3.1 打开文档

3.2 添加段落

1 创建类

2 类的实例

1 基本流程

1.1 简单示例

2 curl_easy API 介绍

流程：

安装 bind9

配置domain.zone

配置 named.conf

检查配置

启动服务

验证DNS

read/write 为什么会被阻塞

引子

__cdecl 调用约定

__stacall 调用约定

__fastcall 调用约定

__thiscall 调用约定

比较

页面

近期文章

归档

分类

标签

链接