今天做的采集程序出错:1366:Incorrect string value: '\xF0\xA3\xAD\x96\xEF\xBC   ...  for column ‘XXX’ at row 1

        仔细核查是因为插入的中文有异体字下面这个异体字,默认的utf8是3个字节的,而这个异仔字是4个字节,因此一插入就出错啦。。。

MySQL插入中文异体字出错.png

        虽然发现是这个异体字的问题,也缠着度娘问了半天,度娘大多时候叫我保存的字段、表的类型设为utf8mb4,只有这个才能保存4个字节的中文,还要将数据库的default-character-set及character-set-server也改为utf8mb4,重启MySQL。

        弄了半天还是是个坑。。。

        最后最后,在插入这个异体字前加一句:set names 'utf8mb4';就可以了。若是set names 'gbk';的话则会使插入的中文变成乱码存储。不过,在phpmyadmin看到保存的4字节汉字是个?号,而3字节的汉字是正常的。。。

        设置为utf8mb4.png

        最后,在TP怎样弄呢?TP的插入数据前加一句mysqli_query("set names utf8mb4"); ???

        当然不是,TP的配置默认字符是utf8,加了那句也没有用。在config.php里面的数据库配置项里面加个'DB_CHARSET' => 'utf8mb4'就行啦。