程序开发 · 2025年7月12日

从 postgres 选择后 UTF8 字符不正确

当前位置: > > > > 从 postgres 选择后 UTF8 字符不正确

来源:stackoverflow
2024-04-19 17:00:35
0浏览
收藏

本篇文章给大家分享《从 postgres 选择后 UTF8 字符不正确》,覆盖了Golang的常见基础知识,其实一个语言的全部知识点一篇文章是不可能说完的,但希望通过这些问题,让读者对自己的掌握程度有一定的认识(B 数),从而弥补自己的不足,更好的掌握它。

问题内容

我在 postgres 中有一个包含电子邮件地址的数据库表。其中一位客户的电子邮件地址中有一个元音变音 (ü)。这不应该是一个问题,但不知何故,go 中的字符串包含错误的字节序列(它是 e3bc 而不是 c3bc),这后来给我带来了一堆问题。

我使用 client_encoding=utf8 连接到数据库,并且数据库设置为 utf8。如果我运行以下命令,我可以看到数据库中的字节序列符合预期:

SELECT encode("email"::bytea, 'hex') FROM participants WHERE  email like 'XXXXXX%';
                    encode                    
----------------------------------------------
                     c3bc

(其余数据已隐藏)

我使用database/sql包和postgres驱动程序读取数据,如果我在go中打印字符串,我会得到xxxxxxe3bcxxxxxx,这不是我所期望的(再次,用x隐藏电子邮件的其余部分)。

这是一个错误,还是我误解了什么?

正确答案

确保您的数据库已正确设置为 UTF8。区域设置在创建数据库时已修复,可能会导致 LOWER 等 sql 函数出现问题。使用 pg_dropclusterpg_createcluster --encoding=UTF8 重新创建数据库。

文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《从 postgres 选择后 UTF8 字符不正确》文章吧,也可关注公众号了解相关技术文章。