pgsql已经更新到beta11了,不同版本的服务器启动或相关命令、配置可能会有不同,所以得根据pg版本进行操作。下面记录一些工作中常用到的一些操作,主要包括服务启动、备份/恢复数据、数据目录迁移、常见操作命令
本文环境:
postgres : v10.3
os: MAC
虽然已经在kong部署中介绍了postgres的部署,为了行文连贯性,这里再简单记录下pg的启动相关命令。
服务启动
安装
brew install postgresql
which psql
~$ /usr/local/bin/psql
执行安装命令后,会连带安装很多有用的pg命令如pg_ctl , postgres, psql等等
启动pg服务
pg_ctl -D /usr/local/var/postgres -l /usr/local/var/postgres/server.log start
这里指定了启动的目录,因为pg默认安装在/usr/local/var/postgres目录下,也可以直接实用pg_ctl start来启动,但是必须设置环境变量PGDATA=/usr/local/var/postgres,否则会报错
$ pg_ctl start
pg_ctl: no database directory specified and environment variable PGDATA unset
Try "pg_ctl --help" for more information.
设置开机自动启动
ln -sfv /usr/local/opt/postgresql/*.plist ~/Library/LaunchAgents launchctl load ~/Library/LaunchAgents/homebrew.mxcl.postgresql.plist
常用命令
查看版本
pg_ctl -V
查看数据库状态、操作
#启动数据库
pg_ctl -D /usr/local/var/postgres -l /usr/local/var/postgres/server.log start #日志路径
cat /usr/local/var/postgres/server.log #查看数据库状态
pg_ctl -D /usr/local/var/postgres -l /usr/local/var/postgres/server.log status #停止
pg_ctl -D /usr/local/var/postgres -l /usr/local/var/postgres/server.log stop -s -m fast #查看数据库进程
ps -ef |grep postgres 或 ps auxwww | grep postgres
创建数据库用户
createuser test_user -P
创建数据库/密码
createdb db_name -O db_pwd -E UTF8 -e
远程进入到psql命令行
psql -U pg_user -d pg_db -h pg_host -p
命令总结
1.用户实用程序:
createdb 创建一个新的PostgreSQL的数据库(和SQL语句:CREATE DATABASE 相同)
createuser 创建一个新的PostgreSQL的用户(和SQL语句:CREATE USER 相同)
dropdb 删除数据库
dropuser 删除用户
pg_dump 将PostgreSQL数据库导出到一个脚本文件
pg_dumpall 将所有的PostgreSQL数据库导出到一个脚本文件
pg_restore 从一个由pg_dump或pg_dumpall程序导出的脚本文件中恢复PostgreSQL数据库
psql 一个基于命令行的PostgreSQL交互式客户端程序
vacuumdb 清理和分析一个PostgreSQL数据库,它是客户端程序psql环境下SQL语句VACUUM的shell脚本封装,二者功能完全相同
2. 系统实用程序
1). pg_ctl 启动、停止、重启PostgreSQL服务(比如:pg_ctl start 启动PostgreSQL服务,它和service postgresql start相同)
2). pg_controldata 显示PostgreSQL服务的内部控制信息
3). psql 切换到PostgreSQL预定义的数据库超级用户postgres,启用客户端程序psql,并连接到自己想要的数据库,比如说:
psql template1
出现以下界面,说明已经进入到想要的数据库,可以进行想要的操作了。
template1=#
3. 在数据库中的一些命令:
template1=# \l 查看系统中现存的数据库
template1=# \q 退出客户端程序psql
template1=# \c 从一个数据库中转到另一个数据库中,如template1=# \c sales 从template1转到sales
template1=# \dt 查看表
template1=# \d 查看表结构
template1=# \di 查看索引
[基本数据库操作]==============
1). *创建数据库: create database [数据库名];
2). *查看数据库列表: \d
3). *删除数据库: . drop database [数据库名];
创建表: create table ([字段名1] [类型1] <references 关联表名(关联的字段名)>;,[字段名2] [类型2],......<,primary key (字段名m,字段名n,...)>;);
*查看表名列表: \d
*查看某个表的状况: \d [表名]
*重命名一个表: alter table [表名A] rename to [表名B];
*删除一个表: drop table [表名];
[表内基本操作]===============
*在已有的表里添加字段: alter table [表名] add column [字段名] [类型];
*删除表中的字段: alter table [表名] drop column [字段名];
*重命名一个字段: alter table [表名] rename column [字段名A] to [字段名B];
*给一个字段设置缺省值: alter table [表名] alter column [字段名] set default [新的默认值];
*去除缺省值: alter table [表名] alter column [字段名] drop default;
在表中插入数据: insert into 表名 ([字段名m],[字段名n],......) values ([列m的值],[列n的值],......);
修改表中的某行某列的数据: update [表名] set [目标字段名]=[目标值] where [该行特征];
删除表中某行数据: delete from [表名] where [该行特征];
delete from [表名];--删空整个表
4. PostgreSQL用户认证
PostgreSQL数据目录中的pg_hba.conf的作用就是用户认证,可以在/usr/local/pgsql/data中找到。
有以下几个例子可以看看:
(1)允许在本机上的任何身份连接任何数据库
TYPE DATABASE USER IP-ADDRESS IP-MASK METHOD
local all all trust(无条件进行连接)
(2)允许IP地址为192.168.1.x的任何主机与数据库sales连接
TYPE DATABASE USER IP-ADDRESS IP-MASK METHOD
host sales all 192.168.1.0 255.255.255.0 ident sameuser(表明任何操作系统用户都能够以同名数据库用户进行连接)
5. 来一个完整的创建PostgreSQL数据库用户的示例吧
(1)进入PostgreSQL高级用户
(2)启用客户端程序,并进入template1数据库
psql template1
(3)创建用户
template1=# CREATE USER hellen WITH ENCRYPED PASSWORD'zhenzhen'
(4)因为设置了密码,所以要编辑pg_hba.conf,使用户和配置文件同步。
在原有记录上面添加md5
local all hellen md5
(5)使用新用户登录数据库
template1=# \q
psql -U hellen -d template1
PS:在一个数据库中如果要切换用户,要使用如下命令:
template1=# \!psql -U tk -d template1
6. 设定用户特定的权限
还是要用例子来说明:
创建一个用户组:
sales=# CREATE GROUP sale;
添加几个用户进入该组
sales=# ALTER GROUP sale ADD USER sale1,sale2,sale3;
授予用户级sale针对表employee和products的SELECT权限
sales=# GRANT SELECT ON employee,products TO GROUP sale;
在sale中将用户user2删除
sales=# ALTER GROUP sale DROP USER sale2;
7. 备份数据库
可以使用pg_dump和pg_dumpall来完成。比如备份sales数据库:
pg_dump sales>/home/tk/pgsql/backup/1.bak
pg数据目录介绍
默认数据目录如下
/usr/local/var/postgres
Linux中可能是:
/var/lib/pgsql/9.5/data
或
/var/lib/postgres/data
或
/home/postgres/data
或其它路径
数据目录结构大致如下:
PG_VERSION #pg版本,如10
base/ #每个 database 会在 base 目录下有一个子目录,存储数据库文件
global/ #存放的文件用于存储全局的系统表信息和全局控制信息
pg_commit_ts/ #包含已提交事务的时间
pg_dynshmem/ #包含动态共享内存子系统使用的文件
pg_hba.conf
pg_ident.conf
pg_logical/ #包含逻辑解码的状态数据
pg_multixact/ #包含多事务状态数据(等待锁定的并发事务
pg_notify/ #包含LISTEN/NOTIFY状态数据
pg_replslot/ #包含复制槽数据
pg_serial/ #包含了已经提交的序列化事务的有关信息
pg_snapshots/ #包含导出的快照
pg_stat/ #包含统计子系统的永久文件
pg_stat_tmp/ #包含统计子系统的临时文件
pg_subtrans/ #包含子事务状态数据
pg_tblspc/ #包含表空间的符号链接
pg_twophase/ #包含预备事务的状态文件
pg_wal/ #包含wal日志
pg_xact/
postgresql.auto.conf #一个用于存储由ALTER SYSTEM 设置的配置参数的文件
postgresql.conf
postmaster.opts #一个记录服务器最后一次启动时使用的命令行参数的文件
server.log #pg操作日志,如果有报错也会记录在这里
base目录介绍
base 目录是最重要的一个目录,放的是每一个 database 的数据。base 目录里的每一个数字目录对于一个 database 的 oid, 可以通过 查看 pg_database 这张表查看每一个 数据库的 oid :
$ cd /usr/local/var/postgres/base
total
drwx------ : ./
drwx------ : ../
drwx------ : /
drwx------ : /
drwx------ : /
drwx------ : /
$
通过数据库查看:
select oid, datname from pg_database ; oid datname
---------------------
postgres
my_test_db
template1
template0
每一张表的数据(大部分)又是放在 base/(dboid)/(relfilenode) 这个文件里面:
select relname, relowner, relfilenode from pg_class where relowner = 16384;
relname | relowner | relfilenode
-----------------------+----------+-------------
pg_toast_24589 | 16384 | 24592
pg_toast_24589_index | 16384 | 24594
pg_toast_24595 | 16384 | 24598
pg_toast_24595_index | 16384 | 24600
item_id_seq | 16384 | 24601
Feed_pkey | 16384 | 167963
feed | 16384 | 24589
item | 16384 | 24595
pg_toast_168003 | 16384 | 168006
pg_toast_168003_index | 16384 | 168008
tmp | 16384 | 168003
(11 rows)
feed 这张表数据在 base/16384/24589 文件里,item 这张表的数据放在 base/16386/24595 这个文件里。也可以用 pg_relation_filepath 这个函数查询:
select pg_relation_filepath('item');
pg_relation_filepath
----------------------
base/16385/24595
(1 row)
当然实际的存储不会这么简单。每一张表的文件都会有一些附加的存储文件,如文件名后加上 _fsm 的是空闲空间映射表 (Free Space Map)。另外 base/(dboid)/(relfilenode) 这个文件超过 1GB 以后,Postgres 会把这个文件拆分成不超过 1G 的多个文件,文件末尾加上 .1 .2 .3 … 做编号。 如 24589 24589.1 24589.2 。据说这是因为某些文件系统支持的最大文件大小有限制(如 fat32 只支持最大 4G )的文件。
global目录介绍
global下有四种文件:
- pg_control
用于存储全局控制信息 - pg_filenode.map
是pg_class里relfilenode为0的系统表,OID与文件的硬编码映射(每个用户创建的数据库目录下也有同名文件)。 - pg_internal.init
是系统表的cache文件,用于加快读取。默认不存在,查询系统表后自动产生. - 全局系统表文件
数字命名的文件,用于存储系统表的内容。它们在pg_class里的relfilenode都为0,是靠pg_filenode.map将OID与文件硬编码映射。(注:不是所有的系统表的relfilenode都为0)
其它文件是需要到pg_class里根据OID查到对应的relfilenode来与文件名匹配的。
例如:tab1的relfilenode是16385,那么16385这个文件就是tab1的数据文件
名字以_fsm结尾的文件是数据文件对应的FSM(free space map)文件,用map方式来标识哪些block是空闲的。用一个Byte而不是bit来标识一个block。对于一个有N个字节的block,它在_fsm文件中第blknum个字节中记录的值是(31+N)/32。通过这种方式标识一个block空闲字节数。FSM中不是简单的数组,而是一个三层的树形结构。FSM文件是在需要用到它时才自动产生的。
名字以_vm结尾的文件是数据文件对应的VM(visibility map)。PostgreSQL中在做多版本并发控制时是通过在元组头上标识“已无效”来实现删除或更新的,最后通过VACUUM功能来清理无效数据回收空闲空间。在做VACUUM时就使用VM开快速查找包含无效元组的block。VM仅是个简单的bitmap,一个bit对应一个block
全局系统表位于global下,例如:pg_database,pg_tablespace,pg_auth_members这种存储系统级对象的表。
库级系统表位于数据库目录下,例如:pg_type,pg_proc,pg_attribute这种存储库级对象的表。
值得注意的是pg_class位于库级目录的里,但也包含全局系统表信息,因此研发或运维人员在改动全局系统表信息时需要注意。
data
├── global # under global, all the filenode is hard-code(select oid,relname,relfilenode from pg_class where relfilenode= order by oid;)
│ ├── # pg_pltemplate
│ ├── # pg_pltemplate_name_index
│ ├── # pg_tablespace
│ ├── # pg_shdepend
│ ├── # pg_shdepend_depender_index
│ ├── # pg_shdepend_reference_index
│ ├── # pg_authid
│ ├── # pg_auth_members
│ ├── # pg_database
│ ├── # pg_shdescription
│ ├── # pg_shdescription_o_c_index
│ ├── # pg_database_datname_index
│ ├── # pg_database_oid_index
│ ├── # pg_authid_rolname_index
│ ├── # pg_authid_oid_index
│ ├── # pg_auth_members_role_member_index
│ ├── # pg_auth_members_member_role_index
│ ├── # pg_tablespace_oid_index
│ ├── # pg_tablespace_spcname_index
│ ├── # pg_toast_2396
│ ├── # pg_toast_2396_index
│ ├── # pg_db_role_setting
│ ├── # pg_db_role_setting_databaseid_rol_index
│ ├── # pg_toast_2964
│ ├── # pg_toast_2964_index
│ ├── # pg_shseclabel
│ ├── # pg_shseclabel_object_index
│ ├── # pg_toast_3592x
│ ├── # pg_toast_3592_index
│ ├── # pg_replication_origin
│ ├── # pg_replication_origin_roiident_index
│ ├── # pg_replication_origin_roname_index
│ ├── pg_control # global control file, use pgcheck -pc to see it.
│ ├── pg_filenode.map # system table (oid -> filenode) mapping file, use pgcheck -pm to see it.
│ └── pg_internal.init # system table cache file, use pgcheck -pr to see it.
表空间目录介绍
my_test_db=# select oid,* from pg_tablespace;
oid | spcname | spcowner | spcacl | spcoptions
-------+------------+----------+--------+------------
1663 | pg_default | 10 | |
1664 | pg_global | 10 | |
49162 | dbspace | 10 | |
(3 rows)
每一个Oid都在/pg_tblspc下对应一个名为Oid的软链接文件,指向真正的space目录。
postgresql.conf文件
文件存储路径,连接配置,资源使用,优化配置,日志设置等
修改需要重启数据库
主要配置如下:
#------------------------------------------------------------------------------
# FILE LOCATIONS
#------------------------------------------------------------------------------ # The default values of these variables are driven from the -D command-line
# option or PGDATA environment variable, represented here as ConfigDir. #data_directory = 'ConfigDir' # use data in another directory
# (change requires restart)
#hba_file = 'ConfigDir/pg_hba.conf' # host-based authentication file
# (change requires restart)
#ident_file = 'ConfigDir/pg_ident.conf' # ident configuration file
# (change requires restart) # If external_pid_file is not explicitly set, no extra PID file is written.
#external_pid_file = '' # write an extra PID file
# (change requires restart) #------------------------------------------------------------------------------
# CONNECTIONS AND AUTHENTICATION
#------------------------------------------------------------------------------ # - Connection Settings - listen_addresses = 'localhost' # what IP address(es) to listen on;
# comma-separated list of addresses;
# defaults to 'localhost'; use '*' for all
# (change requires restart)
port = # (change requires restart)
max_connections = # (change requires restart)
#superuser_reserved_connections = # (change requires restart)
pg_hba.conf 文件
服务器主机连接验证配置文件
修改需要重启数据库
数据备份和恢复
备份库
pg_dump -h PG_HOST -U PG_USER DATABASE > DATABASE.bak
备份表
pg_dump -h localhost -U postgres(用户名) 数据库名(缺省时同用户名) -t table(表名) >data.bak
pg_dump命令参数说明:
pg_dump 把一个数据库转储为纯文本文件或者是其它格式. 用法:
pg_dump [选项]... [数据库名字] 一般选项:
-f, --file=FILENAME 输出文件或目录名
-F, --format=c|d|t|p 输出文件格式 (定制, 目录, tar)
明文 (默认值))
-j, --jobs=NUM 执行多个并行任务进行备份转储工作
-v, --verbose 详细模式
-V, --version 输出版本信息,然后退出
-Z, --compress=- 被压缩格式的压缩级别
--lock-wait-timeout=TIMEOUT 在等待表锁超时后操作失败
-?, --help 显示此帮助, 然后退出
恢复库/表
psql -h PG_HOST -U PG_USER -d DATABASE < DATABASE.bak
或
psql -h PG_HOST -U PG_USER -d DATABASE -f DATABASE.bak
注意:
- 如果直接进入PostgreSQL的安装目录bin下,执行命令,可能会出现 找不到pg_dump,psql的现象,可以用命令的绝对路径,如/usr/local/bin/psql 等
- 如果是远程备份和恢复,必须保证数据库允许外部访问的权限
常见数据库操作
基本和mysql类似
# 创建新表
CREATE TABLE user_tbl(name VARCHAR(20), signup_date DATE); # 插入数据
INSERT INTO user_tbl(name, signup_date) VALUES('张三', '2013-12-22'); # 选择记录
SELECT * FROM user_tbl; # 更新数据
UPDATE user_tbl set name = '李四' WHERE name = '张三'; # 删除记录
DELETE FROM user_tbl WHERE name = '李四' ; # 添加栏位
ALTER TABLE user_tbl ADD email VARCHAR(40); # 更新结构
ALTER TABLE user_tbl ALTER COLUMN signup_date SET NOT NULL; # 更名栏位
ALTER TABLE user_tbl RENAME COLUMN signup_date TO signup; # 删除栏位
ALTER TABLE user_tbl DROP COLUMN email; # 表格更名
ALTER TABLE user_tbl RENAME TO backup_tbl; # 删除表格
DROP TABLE IF EXISTS backup_tbl;
数据目录迁移
通常数据目录会安装在系统盘,而系统盘的空间有限,当数据库量大或日志多时,会撑爆硬盘造成服务停掉,因此通常将数据迁移到数据盘
在CentOS 系统中,pg的默认数据安装目录是
/var/lib/pgsql/{version}/data
数据库服务一般开机自动启动,那么就可以顺藤摸瓜找到相关的service。
对于postgresql10,它的服务名为postgresql-10.service,该文件的路径为:
/usr/lib/systemd/system/postgresql-10.service
postgresql-10.service的文件内容如下:
# It's not recommended to modify this file in-place, because it will be
# overwritten during package upgrades. If you want to customize, the
# best way is to create a file "/etc/systemd/system/postgresql-10.service",
# containing
# .include /lib/systemd/system/postgresql-.service
# ...make your changes here...
# For more info about custom unit files, see
# http://fedoraproject.org/wiki/Systemd#How_do_I_customize_a_unit_file.2F_add_a_custom_unit_file.3F # Note: changing PGDATA will typically require adjusting SELinux
# configuration as well. # Note: do not use a PGDATA pathname containing spaces, or you will
# break postgresql-setup.
[Unit]
Description=PostgreSQL database server
Documentation=https://www.postgresql.org/docs/10/static/
After=syslog.target
After=network.target [Service]
Type=notify
User=postgres
Group=postgres # Note: avoid inserting whitespace in these Environment= lines, or you may
# break postgresql-setup. # Location of database directory
Environment=PGDATA=/home/pgsql/data/ # Where to send early-startup messages from the server (before the logging
# options of postgresql.conf take effect)
# This is normally controlled by the global default set by systemd
# StandardOutput=syslog # Disable OOM kill on the postmaster
OOMScoreAdjust=-
Environment=PG_OOM_ADJUST_FILE=/proc/self/oom_score_adj
Environment=PG_OOM_ADJUST_VALUE= ExecStartPre=/usr/pgsql-/bin/postgresql--check-db-dir ${PGDATA}
ExecStart=/usr/pgsql-/bin/postmaster -D ${PGDATA}
ExecReload=/bin/kill -HUP $MAINPID
KillMode=mixed
KillSignal=SIGINT # Do not set any timeout value, so that systemd will not kill postmaster
# during crash recovery.
TimeoutSec= [Install]
WantedBy=multi-user.target
如果postgresql没有作为服务加到systemctl, 则修改对应的配置文件postgresql.conf中的data_directory的值,通过pg_ctl启动,和下面操作一样
从上面来看里面用到了PGDATA Environment,后面需要修改该变量,但是得先执行下列步骤:
1. 关闭数据库服务
service postgresql- stop
2. 拷贝原先的data目录到新的data目录
sudo cp -rf /var/lib/pgsql//data /home/pgsql/data
3. 设置用户和权限
# 修改data_directory的所有者
sudo chown -R postgres:postgres /home/pgsql/data
# 设置数据目录权限
sudo chmod /home/pgsql/data
4. 上述2、3完成后,可以修改service文件里面的enviroment变量,可以将这个变量修改为自己的data目录
cd /usr/lib/systemd/system/
sudo vi postgresql-.service
~ 修改这个文件中的
Environment=PGDATA=/var/lib/pgsql/10/data/
将其修改为自己的新的数据路径:
Environment=PGDATA=/home/psql/data/
修改PGDATA路径之后,就可以执行下面的命令让其立即生效
sudo systemctl daemon-reload
5. 重启数据库
service postgresql- start
6. 验证
show data_directory;
1)如果还没有改正过来,可以看下PGDATA这个变量的位置,
这个变量的位置在哪呢?这里因为postgresql安装后会自动生成一个postgres用户,因此猜测这个用户下存在PGDATA环境变量
su - postgres ,进入postgres用户下,查看当前用户的环境变量
echo $PGDATA,打印出PGDATA变量值,可以看到这个变量值还是之前那个值。因此我们可以知道了,是这个地方有问题。
于是,修改这个用户的环境变量设置文件
vi ~/.bash_profile,修改里面的PGDATA路径
source ~/.bash_profile使文件生效
再重启数据库服务
2)可能需要postgres用户的宿主目录
cat /etc/passwd
postgres:x:26:26:PostgreSQL Server:/var/lib/pgsql:/bin/bash
sudo usermod -d /home/data/pgsql -u 26 postgres
查看数据库用户
SELECT u.usename AS "User name", u.usesysid AS "User ID"
, CASE
WHEN u.usesuper
AND u.usecreatedb THEN CAST('superuser, createdatabase' AS pg_catalog.text)
WHEN u.usesuper THEN CAST('superuser' AS pg_catalog.text)
WHEN u.usecreatedb THEN CAST('create database' AS pg_catalog.text)
ELSE CAST('' AS pg_catalog.text)
END AS "Attributes"
FROM pg_catalog.pg_user u
ORDER BY 1; -- 或者直接这么查
select * from pg_catalog.pg_user
3)注意:postgresql已经作为服务添加到了systemctl
MAC 系统数据目录迁移思路同上。
参考:
https://blog.csdn.net/guanguoxiang/article/details/46375653