腾讯蓝鲸论坛-专业的技术交流论坛

 找回密码
 立即注册
忘了密码?
搜索
热搜: 用户手册 FAQ
查看: 18863|回复: 26

[官方文档] 社区版3.1常见问题

 关闭 [复制链接]

18

主题

0

好友

5316

积分

超级版主

Rank: 32Rank: 32

发表于 2017-10-29 14:42:53 |显示全部楼层

18

主题

0

好友

5316

积分

超级版主

Rank: 32Rank: 32

发表于 2017-10-29 14:42:54 |显示全部楼层
本帖最后由 huang'q 于 2017-12-21 14:38 编辑

1.  job服务启动失败
  1. 关闭nscd 服务
  2. 证书需要同时用license和gse所在服务器mac地址同时申请
  3. resolv.conf 文件第一行添加 nameserver 127.0.0.1(3台服务器都需要加,若文件中有 option 选项中有 rotate 字样, 需要去掉"rotate",路径/etc/)
  4. license.service.consul 能否解析到 ip(可以用ping,dig)
  5.   p ing  license.service.consul(注意是ping)
  6. 如果不能,检查 consul,license进程是否启动
  7. ./bkcec status consul
  8. ./bkcec status license
  9. --------------如果以上检查没有问题还是无法解析,可以重启consul再解析ip
  10. ./bkcec stop consul
  11. ./bkcec start consul
  12. 日志,登录job所在服务器:/data/bkce/logs/job/job.log
复制代码

18

主题

0

好友

5316

积分

超级版主

Rank: 32Rank: 32

发表于 2017-10-29 14:42:55 |显示全部楼层
本帖最后由 huang'q 于 2017-12-15 17:32 编辑

2.  安装proxy失败
  1. 修改一下 nginx 的配置,把外网ip绑定上:
  2. 登录到 nginx 的机器
  3.      vi  /data/bkce/etc/nginx/miniweb.conf
  4.      server_name x.x.x.x(内网ip) x.x.x.x(外网ip);
  5. 退出到中控机,重启nginx:
  6.     ./bkcec stop nginx
  7.     ./bkcec start nginx
  8. 如果还是失败可以修改48533的监听端口为0.0.0.0
  9. 去gse所在的服务器
  10. vim /data/bkce/etc/gse/task.conf
  11. "tasksvrip":"0.0.0.0",  (新增一行,不要最后一行,注意最后有个逗号)
  12. 重启task
  13. cd /data/bkce/gse/gse/bin/
  14. ./gse.sh stop task
  15. ./gse.sh start task
复制代码
QQ图片20171215173126.png

18

主题

0

好友

5316

积分

超级版主

Rank: 32Rank: 32

发表于 2017-10-29 14:42:56 |显示全部楼层
本帖最后由 huang'q 于 2017-12-21 14:38 编辑

3.  重启后服务异常
  1. 手动把服务起来 ./bkcec start 服务名
  2. resolv.conf文件第一行添加nameserver 127.0.0.1
  3. paas.service.consul 能否解析到ip(可以用ping或者dig)
  4. 如果有服务启动失败,先stop然后start
  5. app启动,进入appo所在服务器
  6. cd /data/bkce/paas_agent/apps/Envs/bk_agent_setup/bin/
  7. ./supervisord -c /data/bkce/paas_agent/apps/projects/bk_agent_setup/conf/supervisord.conf start all
  8. bk_agent_setup可以改为需要启动的app名
复制代码

18

主题

0

好友

5316

积分

超级版主

Rank: 32Rank: 32

发表于 2017-10-29 14:42:57 |显示全部楼层
本帖最后由 huang'q 于 2018-1-9 15:30 编辑

4. 部署app的时候报错
提示:importError:No module named djangi.core.management
QQ图片20171031143119.png

解决方案(进入appo所在服务器):
  1. 检查包是否安装,如下图:
  2. /data/bkce/.envs/paas_agent/bin/pip freeze
复制代码
QQ图片20171031143357.png

如果不一致:
一.  服务器可以连接外网的情况:

QQ图片20171031185841.png
  1. 如果以上操作都不行,
  2. 登录paas页面——开发者中心——服务器信息——删除正式服务器

  3. 登陆中控机:
  4. ./bkcec stop appo

  5. 进入appo所在服务器
  6. 删除目录:/data/bkce/paas_agent/

  7. 登陆中控机:
  8. ./bkcec install appo
  9. ./bkcec start appo
  10. ./bkcec initdata appo
  11. ./bkcec activate appo
复制代码

二.  服务器不能连接外网的情况:

假设,蓝鲸社区版部署在/data下

1.  将需要部署的SaaS安装包下载到本地,解开SaaS包,获取bk_agent_setup\src\requirements.txt(以【Agent安装】为例)

2.  在有外网的机器上,下载requirements.txt里需要的软件包
  1. mkdir python_pkgs
  2. pip install -r requirements.txt --download="python_pkgs"
  3. tar cfz python_pkgs.tar.gz python_pkgs
复制代码
3.  解压软件包到app服务器上
  1. mkdir bkce/paas_agent/pkgs
  2. tar xf python_pkgs.tar.gz -C bkce/paas_agent/pkgs
复制代码
4.  替换pip源
  1. 登录 appo/appt 所在的机器
  2. 替换 /data/bkce/paas_agent/paas_agent/etc/build/virtualenv/saas/buildsaas 92行为:
  3. pip install -r requirements.txt --no-index --find-links=/data/bkce/paas_agent/pkgs/python_pkgs
复制代码
5.  缺少底层编译依赖:有些python安装的时候,依赖一些底层库,例如paramiko需要libffi-devel/openssl-devel等。出现这种问题,需要手动预先安装依赖包,再执行部署app的操作

18

主题

0

好友

5316

积分

超级版主

Rank: 32Rank: 32

发表于 2017-10-29 14:42:58 |显示全部楼层
本帖最后由 huang'q 于 2017-11-28 09:40 编辑

5. initdata bkdata失败

a.ERROR: update_reserved_dataid(databus.tests.DatabusHealthTestCase)
注:如果操作系统是centos7.4的可以改为7.0~7.3
  1. 启动paas,cmdb
  2. 保证bkdata所在服务器可以解析paas.service.consul(可以用ping或者dig)
  3. ——————————以上2条都正常,重新initdata bkdata,如果还失败,请执行以下操作:
  4. 去中控机删除文件:/data/bkce/.initdb_bkdata
  5. 去数据库删除bk_bkdata_api,bkdata_monitor_alert2个库
  6. 重新执行initdata bkdata
复制代码
b. QQ图片20171101192718.png
  1. 这是初始话没完成
  2. 检查服务是否都已经启动,如果没启动则手动启动
  3. 重新执行initdata bkdata
复制代码

18

主题

0

好友

5316

积分

超级版主

Rank: 32Rank: 32

发表于 2017-10-29 14:42:59 |显示全部楼层
本帖最后由 huang'q 于 2017-10-30 15:14 编辑

6.  作业平台——账户管理页面——一直显示的是加载图标
  1. 将userList.zip文件解压,上传到job所在的服务器
  2. cd /data/bkce/job/job
  3. mkdir -p js/app
  4. mv userList.js  js/app
  5. zip -f job-exec.war js/app/userList.js
  6. 重启JOB
  7. cd /data/bkce/job/job/bin/
  8. ./job.sh restart
复制代码

userList.zip

2.43 KB, 下载次数: 20

18

主题

0

好友

5316

积分

超级版主

Rank: 32Rank: 32

发表于 2017-10-29 14:43:00 |显示全部楼层
8.  agent安装app,系统配置里面的ip怎么填写
QQ图片20171029105417.png
  1. Nginx Server:nginx所在服务器ip
  2. TaskServer0:gse所在服务器的ip
  3. zkServer0:zk的ip(可参考hosts文件的zk1,zk2,zk3)
复制代码

18

主题

0

好友

5316

积分

超级版主

Rank: 32Rank: 32

发表于 2017-10-29 14:43:01 |显示全部楼层
本帖最后由 huang'q 于 2017-11-23 10:15 编辑

9.  部署的app怎么重启
以下为重启agent安装app,如果需要重启其它app可以将bk_agent_setup改为需要重启app的路径
  1. 进入appo所在服务器
  2. cd /data/bkce/paas_agent/apps/Envs/bk_agent_setup/bin
  3. 查看app的状态
  4. ./supervisorctl -c /data/bkce/paas_agent/apps/projects/bk_agent_setup/conf/supervisord.conf  status all
  5. 启动app
  6. ./supervisorctl -c /data/bkce/paas_agent/apps/projects/bk_agent_setup/conf/supervisord.conf  start all
  7. 重启app
  8. ./supervisorctl -c /data/bkce/paas_agent/apps/projects/bk_agent_setup/conf/supervisord.conf  restart all
复制代码

18

主题

0

好友

5316

积分

超级版主

Rank: 32Rank: 32

发表于 2017-10-29 14:43:02 |显示全部楼层
本帖最后由 huang'q 于 2017-10-30 15:16 编辑

10.  日志检索es的数据怎么清除
  1. 查看目前所有的索引
  2. curl -XGET http://ES_IP:ES_PORT/_cat/indices
复制代码
如下图
QQ图片20171029113346.png
  1. 删除指定索引
  2. curl -XDELETE 'http://ES_IP:ES_PORT/index_name'

  3. 删除以index_name开头的索引
  4. curl -XDELETE 'http://ES_IP:ES_PORT/index_name*'
复制代码
您需要登录后才可以回帖 登录 | 立即注册

蓝鲸官网

GMT+8, 2018-1-21 12:44

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部