腾讯蓝鲸论坛-专业的技术交流论坛

 找回密码
 立即注册
忘了密码?
搜索
热搜: 用户手册 FAQ
查看: 23427|回复: 40

[官方文档] 蓝鲸智云社区版 FAQ

[复制链接]

43

主题

0

好友

10万

积分

管理员

Rank: 48Rank: 48Rank: 48

发表于 2016-12-21 12:45:04 |显示全部楼层
蓝鲸智云社区版 FAQ

FAQ 目录(请配合CTRL+F搜索关键字)


序号 问题描述楼层
1蓝鲸社区版有哪些模块?如何查看状态,启动和停止服务? 2
2内置应用中的 Agent安装 在一键部署时失败 3
3部署应用过程中,从代码仓库拉取代码提示 'Server certificate verification failed: certificate has expired' 4
4vi bk.conf 时乱码5
5如何卸载蓝鲸v2.0? 6
6访问paas.bking.com显示的页面不对,或者ping paas.bking.com获取的ip不对7
7在Centos7下可能会发生的几个依赖问题8
8我如何知道我的agent状态是正常的?9
9我的Agent正常,但仍然提示未安装10
10什么是业务11
11什么是作业?12
12什么是“执行账户”?13
13使用过程中遇到问题,我可以在哪里反馈?14
14作业平台执行任务的时候提示“IP 未注册”是什么原因?15
15蓝鲸社区版的部署目录结构是怎样的?16
16企业内部有防火墙限制,部署的时候需要开通哪些策略?17
17文件传输支持目录分发吗?18
18支持跨业务执行作业吗?19
19配置平台和作业平台是如何联动的?20
20配置平台里资源池(管理)和空闲机池有何区别?21
21安装完成后默认登陆用户/密码是?22
22重装系统需要备份哪些数据?23
23部署完社区版,访问作业平台,报504错误?24
24安装完Agent后,在配置平台找不到IP?25
25mysql的登录方式以及默认密码是?26
26登录机器终端安装Agent正常,但是ssh远程批量安装时会卡住27
27作业平台执行后台运行的脚本时会卡住28
28执行bk.sh时提示:monit cannot create socket to 127.0.0.1:2812 -- connect refused29
29服务端的操作系统重启后,如何启动服务?30
30V2.0.1windows文件传输失败问题修复方法31
31Agent安装app执行超时问题解决办法32
32配置平台导入主机Excel文件失败33
33
蓝鲸平台到 proxy主机,proxy主机需要开通哪些端口?(非直连区域)34
34Windows无法安装Agent的问题35
35rpm依赖列表36
36用户信息恢复37



43

主题

0

好友

10万

积分

管理员

Rank: 48Rank: 48Rank: 48

发表于 2016-12-21 12:45:18 |显示全部楼层
1. 蓝鲸社区版有哪些模块?如何查看状态,启动和停止服务?

模块信息可以参见蓝鲸社区版V2.0.0用户手册中的 “5. 安装方法 ”说明 。


查看状态,启动和停止服务的说明如下:


(1)基础模块

主要包括配置平台,作业平台,管控平台,部分集成平台。

  1. 部分PaaS平台的操作:
  2. cd /data/paas/open_paas/bin/
  3. 查看状态:
  4. ./dashboard.sh status
  5. 启动服务:
  6. ./start_supervisord.sh                #启动 supervisord
  7. ./dashboard.sh start all                #启动相关的服务
  8. 停止服务:
  9. ./dashboard.sh stop all                #启动相关的服务
  10. dashboard.sh的说明:
  11. ./dashboard.sh status                         #show all configured process
  12. ./dashboard.sh start ${name}         #start program
  13. ./dashboard.sh stop ${name}         #stop program
  14. ./dashboard.sh restart ${name}         #restart program
  15. ./dashboard.sh shutdown                 #dangerous, will stop all programs and supervisord itself
  16. 其他平台的操作:
  17. cd /data/bkv2.0.0
  18. 查看状态:        
  19. ./bk.sh summary
  20. 启动服务:
  21. ./bk.sh start all
  22. 停止服务:
  23. ./bk.sh stop all
  24. bk.sh的说明:
  25. ./bk.sh -h
复制代码
(2)App正式环境

开发者中心里“内置应用”和“我的应用”中的App的正式环境。

  1. Nginx的管理:
  2. cd /data/bkv2.0.0
  3. 查看状态:
  4. ./bk.sh summary
  5. 启动服务:
  6. ./bk.sh start nginx
  7. 停止服务:
  8. ./bk.sh stop nginx
  9. bk.sh的说明:
  10. ./bk.sh -h
  11. App 服务器的管理:
  12. cd /data/paas/paasagent/bin
  13. 查看状态:
  14. ./dashboard.sh status
  15. 启动服务:
  16. ./start_supervisord.sh                #启动 supervisord
  17. ./dashboard.sh start all                #启动相关的服务
  18. 停止服务:
  19. ./dashboard.sh stop all                #启动相关的服务
复制代码
(3)App测试环境

开发者中心里“我的应用”中的App的测试环境。

管理方法和 (2)App正式环境 是一样的。


4RabbitMQ

应用后台任务(celery任务)的消息队列。如果用户需要使用开发者中心里“内置应用”,那么需要安装该环境。

  1. cd /data/paas/service/rabbitmq/sbin/
  2. 查看状态:
  3. ./rabbitmqctl status
  4. 启动服务:
  5. ./rabbitmq-server -detached
  6. 停止服务:
  7. ./rabbitmqctl stop
复制代码

更多RabbitMQ的信息可以参见:https://www.rabbitmq.com/man/rabbitmqctl.1.man.html


43

主题

0

好友

10万

积分

管理员

Rank: 48Rank: 48Rank: 48

发表于 2016-12-21 12:45:22 |显示全部楼层
2. 内置应用中的 Agent安装 在一键部署时失败

错误信息:
1.png


原因:
出现这种问题,一般是软件包存在多个版本。


解决方法:
可参考http://blog.csdn.net/zhuxiang203/article/details/38779779 提供的方式解决冲突。




43

主题

0

好友

10万

积分

管理员

Rank: 48Rank: 48Rank: 48

发表于 2016-12-21 12:45:26 |显示全部楼层
3. 部署应用过程中,从代码仓库拉取代码提示 'Server certificate verification failed: certificate has expired'

错误信息:
2.png


原因:
代码仓库如果是HTTPS协议的话,拉取SVN仓库代码的服务器需要认证信息。

解决方法:
在 APP 正式环境 和 APP 测试环境 的机器上执行如下命令:
  1. svn ls --config-option config:auth:store-auth-creds=yes 你的SVN域名(如:https://code.bk.tencent.com)
复制代码
按提示输入 SVN 管理账户 和 密码后,按 p 永久保存

43

主题

0

好友

10万

积分

管理员

Rank: 48Rank: 48Rank: 48

发表于 2016-12-21 16:32:10 |显示全部楼层
4. vi bk.conf 时乱码

错误信息:
1.png


解决方法:

1. 修改ssh登入软件的编码,如SecureCRT设置为:

2.png

2. 修改环境变量

  1. echo 'let &termencoding=&encoding' >> ~/.vimrc
  2. echo 'set fileencodings=utf-8,gbk,utf-16,big5' >> ~/.vimrc
  3. echo 'export LANG="zh_CN.utf8"' >> ~/.bash_profile
  4. echo 'export LC_ALL="zh_CN.utf8"' >> ~/.bash_profile
  5. export LANG="zh_CN.utf8"
  6. export LC_ALL="zh_CN.utf8"
复制代码

3. 如果还有问题,可以网上找下解决方法


36

主题

0

好友

1775

积分

管理员

Rank: 48Rank: 48Rank: 48

发表于 2016-12-21 22:02:47 |显示全部楼层
5. 如何卸载蓝鲸智云社区版v2.0
Server机器的卸载:
  1. cd /data/bkv2.0.0
  2. ./bk.sh stop all
  3. ./bk.sh stop monit

  4. cd /data/paas/open_paas/bin/
  5. ./dashboard.sh stop all


  6. cd /data/paas/paasagent/bin/
  7. ./dashboard.sh stop all

  8. cd /data/paas/service/rabbitmq/sbin/
  9. ./rabbitmqctl stop

  10. cd /data/paas/env/bin/
  11. ./supervisorctl -c /data/paas/paasagent/etc/supervisord.conf shutdown
  12. ./supervisorctl -c /data/paas/open_paas/bin/supervisord.conf shutdown

  13. 如果有安装了内置应用,或者自己开发了应用,需要再删除对应的supervisord进程:
  14. ps -ef |grep supervisord      # kill掉对应的进程

  15. # 卸载Agent
  16. cd /usr/local/gse/gseagent
  17. ./quit.sh

  18. cd
  19. sleep 3 && rm -rf /data/paas /data/bkv2.0.0 /usr/local/gse
复制代码
Agent机器的卸载:
  1. cd /usr/local/gse/gseagent
  2. ./quit.sh
  3. cd
  4. sleep 3 && rm -rf /usr/local/gse
复制代码

43

主题

0

好友

10万

积分

管理员

Rank: 48Rank: 48Rank: 48

发表于 2016-12-22 12:09:46 |显示全部楼层
6. 访问paas.bking.com显示的页面不对,或者ping paas.bking.com获取的ip不对

解决方法:
如果您用的是windows的机器,请尝试以下的方法:
1. 修改的C:\Windows\System32\drivers\etc\hosts,添加解析,
  1. 您的基础模块ip地址 paas.bking.com
  2. 您的基础模块ip地址 cmdb.bking.com
  3. 您的基础模块ip地址 job.bking.com
复制代码
2. ping这3个域名,如果得到的ip对了,用浏览器中访问paas.bking.com;如果得到的ip不对,再尝试下面的步骤3
3. 在cmd里ipconfig /flushdns,如果ping得到的ip还不对,把windows的dns client服务关了试试。只有是ping得到的ip对了,浏览器访问paas才能正常

16

主题

1

好友

4035

积分

管理员

Rank: 48Rank: 48Rank: 48

发表于 2016-12-23 10:33:39 |显示全部楼层
7. 在centos7下可能会发生的几个依赖问题

   如果是centos 7

  • 安装python27-2.7.12-1.x86_64.rpm 失败
  1. $ rpm -e python27-2.7.12-1; rpm -ivhU bin/rpms/python27-2.7.12-1.x86_64.rpm
  2. error: package python27-2.7.12-1 is not installed
  3. error: Failed dependencies:
  4. bzip2 is needed by python27-2.7.12-1.x86_64
  5. openssl is needed by python27-2.7.12-1.x86_64
  6. db4 is needed by python27-2.7.12-1.x86_64

  7. $ yum install bzip2 openssl db4
复制代码

此时 db4 无法装上, 需要
  1. $ yum -y install epel* db4
复制代码

  • 安装完成后四个 web 服务启动失败

在logs/*_uwsgi.log 中

  1. /data/paas/open_paas/Envs/paas/bin/uwsgi: error while loading shared libraries: libpcre.so.0: cannot open shared  object file: No such file or directory
复制代码
原因:  centos 7 的 so 文件变化导致的
处理:
  1. link /usr/lib64/libpcre.so.1 /lib64/libpcre.so.0
复制代码
  • bin/uwsgi: error while loading shared libraries: libpcre.so.0
  1. ./bin/dashboard.sh status
  2. appengine   FATAL    Exited too quickly (process log may have details)
  3. esb               FATAL    Exited too quickly (process log may have details)
  4. login            FATAL     Exited too quickly (process log may have details)
  5. paas             FATAL     Exited too quickly (process log may have details)
复制代码
且查看/data/paas/open_paas/logs/supervisord/*_err.log
  1. /data/paas/open_paas/Envs/paas/bin/uwsgi: error while loading shared libraries: libpcre.so.0: cannot open shared object file: No such file or directory
复制代码
这是uwsgi 缺乏依赖导致的.
  1. $ yum install pcre pcre-devel
  2. $ ln -s /usr/lib64/libpcre.so /usr/lib64/libpcre.so.0
复制代码

43

主题

0

好友

10万

积分

管理员

Rank: 48Rank: 48Rank: 48

发表于 2016-12-23 11:49:05 |显示全部楼层
8. 我如何知道我的agent状态是正常的?

打开作业平台,选择作业执行->快速脚本执行->选择服务器可以看到服务器的Agent状态。

43

主题

0

好友

10万

积分

管理员

Rank: 48Rank: 48Rank: 48

发表于 2016-12-23 11:50:19 |显示全部楼层
9. 我的Agent安装正常,但仍然提示未安装

请尝试参照以下步骤解决:
●    如果Agent安装过程没有报错,请耐心等待2分钟左右,然后重新刷新作业平台页面查看Agent状态
●    执行ps -ef |grep bk_gse_agent ,如果Agent正常,将显示两个进程
●    执行netstat -antlp | grep 48533 ,如果Agent正常,将至少显示一条ESTABLISHED的连接
●    检查Agent配置文件是否正确
❖     在Agent所在服务器上执行grep zkhost gse/gseagent/conf/gse.conf,如果配置正确,zkhost配置的IP应该是您Server的IP,而且Agent可以通过此IP和Server通信
●    检查bk_gse_task的日志:
❖     如果除了Server服务器之外其他Agent均提示未安装,说明Agent证书有问题,可以查看bk_gse_task的日志文件gse/gsetask/logs/yyyymmdd-xxxxx.log,如果出现client cert invalid, ip=xxx.xxx.xxx.xxx,说明xxx.xxx.xxx.xxx的证书和Server证书不一致,请检查并同步证书,使用安装指引里的curl命令重新安装Agent
❖     如果所有服务器执行均提示未安装,可能是Server端的进程没有启动正常,请执行./bk.sh summary确认Server端进程是否正常;也可能是Server的证书有问题,请查看bk_gse_task的日志gse/gsetask/logs/yyyymmdd-xxxxx.log,如果出现Could not SSL accept说明证书有问题,请重新安装Server端。
●    请检查服务器是否属于多IP系统,如果是,请确保配置平台里写入的IP和server的IP是否属于同一网段并且可以内网通信,如果不一致请在配置平台删除错误IP,重新导入正确IP


您需要登录后才可以回帖 登录 | 立即注册

蓝鲸官网

GMT+8, 2018-1-21 12:44

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部