最主要是这个堆栈一样的线程有几十个,我想区分谁建立的。
STACK_TEXT:
16d9fc1c 0dad2e1c e06d7363 00000001 00000003 KERNELBASE!RaiseException+0x58
WARNING: Stack unwind information not available. Following frames may be wrong.
16d9fc54 0dad29ed 16d9fc64 0db153bc 0daf066c thosttraderapi!CThostFtdcTraderApi::CreateFtdcTraderApi+0x58fcc
16d9fc70 0da7040a 00004040 45d73da4 1460ccac thosttraderapi!CThostFtdcTraderApi::CreateFtdcTraderApi+0x58b9d
16d9fd84 60a611d3 1460df30 a023af03 00000000 thosttraderapi+0x6040a
16d9fdbc 765c337a 0e383f48 16d9fe08 77bd9882 verifier!AVrfpStandardThreadFunction+0x2f
16d9fdc8 77bd9882 0e383f48 b74fca00 00000000 kernel32!BaseThreadInitThunk+0xe
16d9fe08 77bd9855 60a611a4 0e383f48 00000000 ntdll!__RtlUserThreadStart+0x70
16d9fe20 00000000 60a611a4 0e383f48 00000000 ntdll!_RtlUserThreadStart+0x1b
这段堆栈信息只能看到线程启动到崩溃,但是我怎么知道谁启动了这个线程呢?
通过线程堆栈我估计够呛,各位如何确定的呢? 有没有什么好方法?
16 个解决方案
#1
为什么不在创建新线程相关的那几个API上设断点观察呢?
#2
在CreateThread()上设置断点观察?
#3
关键是崩溃的时候,拿到dmp,这个是无法源代码调试的,我要反过来定位到那段代码搞的。
要是自己开发调试,那不是简单多了
对了,前面搞崩溃文件2个月,找到3处经常崩溃的地方加了try
一处内存暴增,正在分析到底为什么调用那么多次,最终解决还是崩溃dmp的内存记录了每次分配的堆栈找到的
但是建立线程反向跟踪怎么找呢?
要是自己开发调试,那不是简单多了
对了,前面搞崩溃文件2个月,找到3处经常崩溃的地方加了try
一处内存暴增,正在分析到底为什么调用那么多次,最终解决还是崩溃dmp的内存记录了每次分配的堆栈找到的
但是建立线程反向跟踪怎么找呢?
#4
打断点喽,是不是?
#5
断点什么啊,客户的崩溃文件
#6
有时不将“调用函数名字+各参数值,进入函数后各参数值,中间变量值,退出函数前准备返回的值,返回函数到调用处后函数名字+各参数值+返回值”这些信息写日志到文件中是无论如何也发现不了问题在哪里的,包括捕获各种异常、写日志到屏幕、单步或设断点或生成core文件、……这些方法都不行! 写日志到文件参考下面:
//循环向a函数每次发送200个字节长度(这个是固定的)的buffer,
//a函数中需要将循环传进来的buffer,组成240字节(也是固定的)的新buffer进行处理,
//在处理的时候每次从新buffer中取两个字节打印
#ifdef WIN32
#pragma warning(disable:4996)
#endif
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#ifdef WIN32
#include <windows.h>
#include <process.h>
#include <io.h>
#define MYVOID void
#define vsnprintf _vsnprintf
#else
#include <unistd.h>
#include <sys/time.h>
#include <pthread.h>
#define CRITICAL_SECTION pthread_mutex_t
#define MYVOID void *
#endif
//Log{
#define MAXLOGSIZE 20000000
#define MAXLINSIZE 16000
#include <time.h>
#include <sys/timeb.h>
#include <stdarg.h>
char logfilename1[]="MyLog1.log";
char logfilename2[]="MyLog2.log";
static char logstr[MAXLINSIZE+1];
char datestr[16];
char timestr[16];
char mss[4];
CRITICAL_SECTION cs_log;
FILE *flog;
#ifdef WIN32
void Lock(CRITICAL_SECTION *l) {
EnterCriticalSection(l);
}
void Unlock(CRITICAL_SECTION *l) {
LeaveCriticalSection(l);
}
void sleep_ms(int ms) {
Sleep(ms);
}
#else
void Lock(CRITICAL_SECTION *l) {
pthread_mutex_lock(l);
}
void Unlock(CRITICAL_SECTION *l) {
pthread_mutex_unlock(l);
}
void sleep_ms(int ms) {
usleep(ms*1000);
}
#endif
void LogV(const char *pszFmt,va_list argp) {
struct tm *now;
struct timeb tb;
if (NULL==pszFmt||0==pszFmt[0]) return;
vsnprintf(logstr,MAXLINSIZE,pszFmt,argp);
ftime(&tb);
now=localtime(&tb.time);
sprintf(datestr,"%04d-%02d-%02d",now->tm_year+1900,now->tm_mon+1,now->tm_mday);
sprintf(timestr,"%02d:%02d:%02d",now->tm_hour ,now->tm_min ,now->tm_sec );
sprintf(mss,"%03d",tb.millitm);
printf("%s %s.%s %s",datestr,timestr,mss,logstr);
flog=fopen(logfilename1,"a");
if (NULL!=flog) {
fprintf(flog,"%s %s.%s %s",datestr,timestr,mss,logstr);
if (ftell(flog)>MAXLOGSIZE) {
fclose(flog);
if (rename(logfilename1,logfilename2)) {
remove(logfilename2);
rename(logfilename1,logfilename2);
}
} else {
fclose(flog);
}
}
}
void Log(const char *pszFmt,...) {
va_list argp;
Lock(&cs_log);
va_start(argp,pszFmt);
LogV(pszFmt,argp);
va_end(argp);
Unlock(&cs_log);
}
//Log}
#define ASIZE 200
#define BSIZE 240
#define CSIZE 2
char Abuf[ASIZE];
char Cbuf[CSIZE];
CRITICAL_SECTION cs_HEX ;
CRITICAL_SECTION cs_BBB ;
struct FIFO_BUFFER {
int head;
int tail;
int size;
char data[BSIZE];
} BBB;
int No_Loop=0;
void HexDump(int cn,char *buf,int len) {
int i,j,k;
char binstr[80];
Lock(&cs_HEX);
for (i=0;i<len;i++) {
if (0==(i%16)) {
sprintf(binstr,"%03d %04x -",cn,i);
sprintf(binstr,"%s %02x",binstr,(unsigned char)buf[i]);
} else if (15==(i%16)) {
sprintf(binstr,"%s %02x",binstr,(unsigned char)buf[i]);
sprintf(binstr,"%s ",binstr);
for (j=i-15;j<=i;j++) {
sprintf(binstr,"%s%c",binstr,('!'<buf[j]&&buf[j]<='~')?buf[j]:'.');
}
Log("%s\n",binstr);
} else {
sprintf(binstr,"%s %02x",binstr,(unsigned char)buf[i]);
}
}
if (0!=(i%16)) {
k=16-(i%16);
for (j=0;j<k;j++) {
sprintf(binstr,"%s ",binstr);
}
sprintf(binstr,"%s ",binstr);
k=16-k;
for (j=i-k;j<i;j++) {
sprintf(binstr,"%s%c",binstr,('!'<buf[j]&&buf[j]<='~')?buf[j]:'.');
}
Log("%s\n",binstr);
}
Unlock(&cs_HEX);
}
int GetFromRBuf(int cn,CRITICAL_SECTION *cs,struct FIFO_BUFFER *fbuf,char *buf,int len) {
int lent,len1,len2;
lent=0;
Lock(cs);
if (fbuf->size>=len) {
lent=len;
if (fbuf->head+lent>BSIZE) {
len1=BSIZE-fbuf->head;
memcpy(buf ,fbuf->data+fbuf->head,len1);
len2=lent-len1;
memcpy(buf+len1,fbuf->data ,len2);
fbuf->head=len2;
} else {
memcpy(buf ,fbuf->data+fbuf->head,lent);
fbuf->head+=lent;
}
fbuf->size-=lent;
}
Unlock(cs);
return lent;
}
MYVOID thdB(void *pcn) {
char *recv_buf;
int recv_nbytes;
int cn;
int wc;
int pb;
cn=(int)pcn;
Log("%03d thdB thread begin...\n",cn);
while (1) {
sleep_ms(10);
recv_buf=(char *)Cbuf;
recv_nbytes=CSIZE;
wc=0;
while (1) {
pb=GetFromRBuf(cn,&cs_BBB,&BBB,recv_buf,recv_nbytes);
if (pb) {
Log("%03d recv %d bytes\n",cn,pb);
HexDump(cn,recv_buf,pb);
sleep_ms(1);
} else {
sleep_ms(1000);
}
if (No_Loop) break;//
wc++;
if (wc>3600) Log("%03d %d==wc>3600!\n",cn,wc);
}
if (No_Loop) break;//
}
#ifndef WIN32
pthread_exit(NULL);
#endif
}
int PutToRBuf(int cn,CRITICAL_SECTION *cs,struct FIFO_BUFFER *fbuf,char *buf,int len) {
int lent,len1,len2;
Lock(cs);
lent=len;
if (fbuf->size+lent>BSIZE) {
lent=BSIZE-fbuf->size;
}
if (fbuf->tail+lent>BSIZE) {
len1=BSIZE-fbuf->tail;
memcpy(fbuf->data+fbuf->tail,buf ,len1);
len2=lent-len1;
memcpy(fbuf->data ,buf+len1,len2);
fbuf->tail=len2;
} else {
memcpy(fbuf->data+fbuf->tail,buf ,lent);
fbuf->tail+=lent;
}
fbuf->size+=lent;
Unlock(cs);
return lent;
}
MYVOID thdA(void *pcn) {
char *send_buf;
int send_nbytes;
int cn;
int wc;
int a;
int pa;
cn=(int)pcn;
Log("%03d thdA thread begin...\n",cn);
a=0;
while (1) {
sleep_ms(100);
memset(Abuf,a,ASIZE);
a=(a+1)%256;
if (16==a) {No_Loop=1;break;}//去掉这句可以让程序一直循环直到按Ctrl+C或Ctrl+Break或当前目录下存在文件No_Loop
send_buf=(char *)Abuf;
send_nbytes=ASIZE;
Log("%03d sending %d bytes\n",cn,send_nbytes);
HexDump(cn,send_buf,send_nbytes);
wc=0;
while (1) {
pa=PutToRBuf(cn,&cs_BBB,&BBB,send_buf,send_nbytes);
Log("%03d sent %d bytes\n",cn,pa);
HexDump(cn,send_buf,pa);
send_buf+=pa;
send_nbytes-=pa;
if (send_nbytes<=0) break;//
sleep_ms(1000);
if (No_Loop) break;//
wc++;
if (wc>3600) Log("%03d %d==wc>3600!\n",cn,wc);
}
if (No_Loop) break;//
}
#ifndef WIN32
pthread_exit(NULL);
#endif
}
int main() {
#ifdef WIN32
InitializeCriticalSection(&cs_log);
InitializeCriticalSection(&cs_HEX );
InitializeCriticalSection(&cs_BBB );
#else
pthread_t threads[2];
int threadsN;
int rc;
pthread_mutex_init(&cs_log,NULL);
pthread_mutex_init(&cs_HEX,NULL);
pthread_mutex_init(&cs_BBB,NULL);
#endif
Log("Start===========================================================\n");
BBB.head=0;
BBB.tail=0;
BBB.size=0;
#ifdef WIN32
_beginthread((void(__cdecl *)(void *))thdA,0,(void *)1);
_beginthread((void(__cdecl *)(void *))thdB,0,(void *)2);
#else
threadsN=0;
rc=pthread_create(&(threads[threadsN++]),NULL,thdA,(void *)1);if (rc) Log("%d=pthread_create %d error!\n",rc,threadsN-1);
rc=pthread_create(&(threads[threadsN++]),NULL,thdB,(void *)2);if (rc) Log("%d=pthread_create %d error!\n",rc,threadsN-1);
#endif
if (!access("No_Loop",0)) {
remove("No_Loop");
if (!access("No_Loop",0)) {
No_Loop=1;
}
}
while (1) {
sleep_ms(1000);
if (No_Loop) break;//
if (!access("No_Loop",0)) {
No_Loop=1;
}
}
sleep_ms(3000);
Log("End=============================================================\n");
#ifdef WIN32
DeleteCriticalSection(&cs_BBB );
DeleteCriticalSection(&cs_HEX );
DeleteCriticalSection(&cs_log);
#else
pthread_mutex_destroy(&cs_BBB);
pthread_mutex_destroy(&cs_HEX);
pthread_mutex_destroy(&cs_log);
#endif
return 0;
}
#7
知道谁启动的有什么意义?不让他启动?
#8
缩小故障定位范围,工程有十几个项目,下面又带有多个柜台的程序,底层多个通信通道,对上层也有通信通道
#9
每个项目都有自己的服务吧?能通过服务定位吗?(现象、日志等等)
#10
知道谁启动的有什么意义?不让他启动?
缩小故障定位范围,工程有十几个项目,下面又带有多个柜台的程序,底层多个通信通道,对上层也有通信通道
每个项目都有自己的服务吧?能通过服务定位吗?(现象、日志等等)
柜台雷同,例如多个CTP柜台,多个googlebuffer通道,多个zmq和rmq通道,还有多个定时器线程、wcf通道,看着栈基本雷同,很难区分。
我虽然用debugdiag打印了线程创建时的栈,但这也是创建的时候线程的栈,而不是创建者的栈,没法回溯到底谁创建的,位置在哪里创建的。
#11
知道谁启动的有什么意义?不让他启动?
缩小故障定位范围,工程有十几个项目,下面又带有多个柜台的程序,底层多个通信通道,对上层也有通信通道
每个项目都有自己的服务吧?能通过服务定位吗?(现象、日志等等)
日志就难了,创建线程一般都不打印线程号,有很多也是在别人的dll里面创建的,这个更没法把控了。
且很多线程属于守候线程,平时在哪里也不动,基本上都是在等待socket通信。
#12
知道谁启动的有什么意义?不让他启动?
缩小故障定位范围,工程有十几个项目,下面又带有多个柜台的程序,底层多个通信通道,对上层也有通信通道
每个项目都有自己的服务吧?能通过服务定位吗?(现象、日志等等)
日志就难了,创建线程一般都不打印线程号,有很多也是在别人的dll里面创建的,这个更没法把控了。
且很多线程属于守候线程,平时在哪里也不动,基本上都是在等待socket通信。
感觉是设计的问题,而不是技术的问题;设计导致了这种难以定位的结果;能先缩小范围吗?
#13
为什么不在创建新线程相关的那几个API上设断点观察呢?
为什么不在创建新线程相关的那几个API上设断点观察Call Stack中内容以确定属于哪个进程的哪个线程要创建当前线程呢?
#15
这个帖子结贴吧,实际上是上期所的CTP的dll内部内存泄露导致的崩溃,2016年4月份给上期所邮件,他们已经修改了代码发布新版本解决了这个问题。
20160613版本,没记错的话
去年一整年都在学习异常调试技术,基本解决了程序稳定性问题,不过由于大部分代码不是自己编写,且内部到底还存在哪些逻辑上的崩溃点还不能完全摸清楚。
实际上这个崩溃点是基本上天天崩溃,解决了这个问题后,我们的产品又陆续出现多次崩溃,不过在代码控制范围内基本都解决了。
由于已经非常熟悉崩溃调试,所以在代码控制范围内准确定位的,基本上2个小时之内就可以解决。但是对于栈被破坏的release版本,目前还是一头雾水,debug版本还有点疑问,过会另外开贴咨询。
20160613版本,没记错的话
去年一整年都在学习异常调试技术,基本解决了程序稳定性问题,不过由于大部分代码不是自己编写,且内部到底还存在哪些逻辑上的崩溃点还不能完全摸清楚。
实际上这个崩溃点是基本上天天崩溃,解决了这个问题后,我们的产品又陆续出现多次崩溃,不过在代码控制范围内基本都解决了。
由于已经非常熟悉崩溃调试,所以在代码控制范围内准确定位的,基本上2个小时之内就可以解决。但是对于栈被破坏的release版本,目前还是一头雾水,debug版本还有点疑问,过会另外开贴咨询。
#16
另外关于如何知道哪个模块启动了线程,PROCESS MONITOR可以看到线程启动的时候谁调用启动的,总体来说解决了我另外一个疑问
#1
为什么不在创建新线程相关的那几个API上设断点观察呢?
#2
在CreateThread()上设置断点观察?
#3
关键是崩溃的时候,拿到dmp,这个是无法源代码调试的,我要反过来定位到那段代码搞的。
要是自己开发调试,那不是简单多了
对了,前面搞崩溃文件2个月,找到3处经常崩溃的地方加了try
一处内存暴增,正在分析到底为什么调用那么多次,最终解决还是崩溃dmp的内存记录了每次分配的堆栈找到的
但是建立线程反向跟踪怎么找呢?
要是自己开发调试,那不是简单多了
对了,前面搞崩溃文件2个月,找到3处经常崩溃的地方加了try
一处内存暴增,正在分析到底为什么调用那么多次,最终解决还是崩溃dmp的内存记录了每次分配的堆栈找到的
但是建立线程反向跟踪怎么找呢?
#4
打断点喽,是不是?
#5
断点什么啊,客户的崩溃文件
#6
有时不将“调用函数名字+各参数值,进入函数后各参数值,中间变量值,退出函数前准备返回的值,返回函数到调用处后函数名字+各参数值+返回值”这些信息写日志到文件中是无论如何也发现不了问题在哪里的,包括捕获各种异常、写日志到屏幕、单步或设断点或生成core文件、……这些方法都不行! 写日志到文件参考下面:
//循环向a函数每次发送200个字节长度(这个是固定的)的buffer,
//a函数中需要将循环传进来的buffer,组成240字节(也是固定的)的新buffer进行处理,
//在处理的时候每次从新buffer中取两个字节打印
#ifdef WIN32
#pragma warning(disable:4996)
#endif
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#ifdef WIN32
#include <windows.h>
#include <process.h>
#include <io.h>
#define MYVOID void
#define vsnprintf _vsnprintf
#else
#include <unistd.h>
#include <sys/time.h>
#include <pthread.h>
#define CRITICAL_SECTION pthread_mutex_t
#define MYVOID void *
#endif
//Log{
#define MAXLOGSIZE 20000000
#define MAXLINSIZE 16000
#include <time.h>
#include <sys/timeb.h>
#include <stdarg.h>
char logfilename1[]="MyLog1.log";
char logfilename2[]="MyLog2.log";
static char logstr[MAXLINSIZE+1];
char datestr[16];
char timestr[16];
char mss[4];
CRITICAL_SECTION cs_log;
FILE *flog;
#ifdef WIN32
void Lock(CRITICAL_SECTION *l) {
EnterCriticalSection(l);
}
void Unlock(CRITICAL_SECTION *l) {
LeaveCriticalSection(l);
}
void sleep_ms(int ms) {
Sleep(ms);
}
#else
void Lock(CRITICAL_SECTION *l) {
pthread_mutex_lock(l);
}
void Unlock(CRITICAL_SECTION *l) {
pthread_mutex_unlock(l);
}
void sleep_ms(int ms) {
usleep(ms*1000);
}
#endif
void LogV(const char *pszFmt,va_list argp) {
struct tm *now;
struct timeb tb;
if (NULL==pszFmt||0==pszFmt[0]) return;
vsnprintf(logstr,MAXLINSIZE,pszFmt,argp);
ftime(&tb);
now=localtime(&tb.time);
sprintf(datestr,"%04d-%02d-%02d",now->tm_year+1900,now->tm_mon+1,now->tm_mday);
sprintf(timestr,"%02d:%02d:%02d",now->tm_hour ,now->tm_min ,now->tm_sec );
sprintf(mss,"%03d",tb.millitm);
printf("%s %s.%s %s",datestr,timestr,mss,logstr);
flog=fopen(logfilename1,"a");
if (NULL!=flog) {
fprintf(flog,"%s %s.%s %s",datestr,timestr,mss,logstr);
if (ftell(flog)>MAXLOGSIZE) {
fclose(flog);
if (rename(logfilename1,logfilename2)) {
remove(logfilename2);
rename(logfilename1,logfilename2);
}
} else {
fclose(flog);
}
}
}
void Log(const char *pszFmt,...) {
va_list argp;
Lock(&cs_log);
va_start(argp,pszFmt);
LogV(pszFmt,argp);
va_end(argp);
Unlock(&cs_log);
}
//Log}
#define ASIZE 200
#define BSIZE 240
#define CSIZE 2
char Abuf[ASIZE];
char Cbuf[CSIZE];
CRITICAL_SECTION cs_HEX ;
CRITICAL_SECTION cs_BBB ;
struct FIFO_BUFFER {
int head;
int tail;
int size;
char data[BSIZE];
} BBB;
int No_Loop=0;
void HexDump(int cn,char *buf,int len) {
int i,j,k;
char binstr[80];
Lock(&cs_HEX);
for (i=0;i<len;i++) {
if (0==(i%16)) {
sprintf(binstr,"%03d %04x -",cn,i);
sprintf(binstr,"%s %02x",binstr,(unsigned char)buf[i]);
} else if (15==(i%16)) {
sprintf(binstr,"%s %02x",binstr,(unsigned char)buf[i]);
sprintf(binstr,"%s ",binstr);
for (j=i-15;j<=i;j++) {
sprintf(binstr,"%s%c",binstr,('!'<buf[j]&&buf[j]<='~')?buf[j]:'.');
}
Log("%s\n",binstr);
} else {
sprintf(binstr,"%s %02x",binstr,(unsigned char)buf[i]);
}
}
if (0!=(i%16)) {
k=16-(i%16);
for (j=0;j<k;j++) {
sprintf(binstr,"%s ",binstr);
}
sprintf(binstr,"%s ",binstr);
k=16-k;
for (j=i-k;j<i;j++) {
sprintf(binstr,"%s%c",binstr,('!'<buf[j]&&buf[j]<='~')?buf[j]:'.');
}
Log("%s\n",binstr);
}
Unlock(&cs_HEX);
}
int GetFromRBuf(int cn,CRITICAL_SECTION *cs,struct FIFO_BUFFER *fbuf,char *buf,int len) {
int lent,len1,len2;
lent=0;
Lock(cs);
if (fbuf->size>=len) {
lent=len;
if (fbuf->head+lent>BSIZE) {
len1=BSIZE-fbuf->head;
memcpy(buf ,fbuf->data+fbuf->head,len1);
len2=lent-len1;
memcpy(buf+len1,fbuf->data ,len2);
fbuf->head=len2;
} else {
memcpy(buf ,fbuf->data+fbuf->head,lent);
fbuf->head+=lent;
}
fbuf->size-=lent;
}
Unlock(cs);
return lent;
}
MYVOID thdB(void *pcn) {
char *recv_buf;
int recv_nbytes;
int cn;
int wc;
int pb;
cn=(int)pcn;
Log("%03d thdB thread begin...\n",cn);
while (1) {
sleep_ms(10);
recv_buf=(char *)Cbuf;
recv_nbytes=CSIZE;
wc=0;
while (1) {
pb=GetFromRBuf(cn,&cs_BBB,&BBB,recv_buf,recv_nbytes);
if (pb) {
Log("%03d recv %d bytes\n",cn,pb);
HexDump(cn,recv_buf,pb);
sleep_ms(1);
} else {
sleep_ms(1000);
}
if (No_Loop) break;//
wc++;
if (wc>3600) Log("%03d %d==wc>3600!\n",cn,wc);
}
if (No_Loop) break;//
}
#ifndef WIN32
pthread_exit(NULL);
#endif
}
int PutToRBuf(int cn,CRITICAL_SECTION *cs,struct FIFO_BUFFER *fbuf,char *buf,int len) {
int lent,len1,len2;
Lock(cs);
lent=len;
if (fbuf->size+lent>BSIZE) {
lent=BSIZE-fbuf->size;
}
if (fbuf->tail+lent>BSIZE) {
len1=BSIZE-fbuf->tail;
memcpy(fbuf->data+fbuf->tail,buf ,len1);
len2=lent-len1;
memcpy(fbuf->data ,buf+len1,len2);
fbuf->tail=len2;
} else {
memcpy(fbuf->data+fbuf->tail,buf ,lent);
fbuf->tail+=lent;
}
fbuf->size+=lent;
Unlock(cs);
return lent;
}
MYVOID thdA(void *pcn) {
char *send_buf;
int send_nbytes;
int cn;
int wc;
int a;
int pa;
cn=(int)pcn;
Log("%03d thdA thread begin...\n",cn);
a=0;
while (1) {
sleep_ms(100);
memset(Abuf,a,ASIZE);
a=(a+1)%256;
if (16==a) {No_Loop=1;break;}//去掉这句可以让程序一直循环直到按Ctrl+C或Ctrl+Break或当前目录下存在文件No_Loop
send_buf=(char *)Abuf;
send_nbytes=ASIZE;
Log("%03d sending %d bytes\n",cn,send_nbytes);
HexDump(cn,send_buf,send_nbytes);
wc=0;
while (1) {
pa=PutToRBuf(cn,&cs_BBB,&BBB,send_buf,send_nbytes);
Log("%03d sent %d bytes\n",cn,pa);
HexDump(cn,send_buf,pa);
send_buf+=pa;
send_nbytes-=pa;
if (send_nbytes<=0) break;//
sleep_ms(1000);
if (No_Loop) break;//
wc++;
if (wc>3600) Log("%03d %d==wc>3600!\n",cn,wc);
}
if (No_Loop) break;//
}
#ifndef WIN32
pthread_exit(NULL);
#endif
}
int main() {
#ifdef WIN32
InitializeCriticalSection(&cs_log);
InitializeCriticalSection(&cs_HEX );
InitializeCriticalSection(&cs_BBB );
#else
pthread_t threads[2];
int threadsN;
int rc;
pthread_mutex_init(&cs_log,NULL);
pthread_mutex_init(&cs_HEX,NULL);
pthread_mutex_init(&cs_BBB,NULL);
#endif
Log("Start===========================================================\n");
BBB.head=0;
BBB.tail=0;
BBB.size=0;
#ifdef WIN32
_beginthread((void(__cdecl *)(void *))thdA,0,(void *)1);
_beginthread((void(__cdecl *)(void *))thdB,0,(void *)2);
#else
threadsN=0;
rc=pthread_create(&(threads[threadsN++]),NULL,thdA,(void *)1);if (rc) Log("%d=pthread_create %d error!\n",rc,threadsN-1);
rc=pthread_create(&(threads[threadsN++]),NULL,thdB,(void *)2);if (rc) Log("%d=pthread_create %d error!\n",rc,threadsN-1);
#endif
if (!access("No_Loop",0)) {
remove("No_Loop");
if (!access("No_Loop",0)) {
No_Loop=1;
}
}
while (1) {
sleep_ms(1000);
if (No_Loop) break;//
if (!access("No_Loop",0)) {
No_Loop=1;
}
}
sleep_ms(3000);
Log("End=============================================================\n");
#ifdef WIN32
DeleteCriticalSection(&cs_BBB );
DeleteCriticalSection(&cs_HEX );
DeleteCriticalSection(&cs_log);
#else
pthread_mutex_destroy(&cs_BBB);
pthread_mutex_destroy(&cs_HEX);
pthread_mutex_destroy(&cs_log);
#endif
return 0;
}
#7
知道谁启动的有什么意义?不让他启动?
#8
知道谁启动的有什么意义?不让他启动?
缩小故障定位范围,工程有十几个项目,下面又带有多个柜台的程序,底层多个通信通道,对上层也有通信通道
#9
知道谁启动的有什么意义?不让他启动?
缩小故障定位范围,工程有十几个项目,下面又带有多个柜台的程序,底层多个通信通道,对上层也有通信通道
每个项目都有自己的服务吧?能通过服务定位吗?(现象、日志等等)
#10
知道谁启动的有什么意义?不让他启动?
缩小故障定位范围,工程有十几个项目,下面又带有多个柜台的程序,底层多个通信通道,对上层也有通信通道
每个项目都有自己的服务吧?能通过服务定位吗?(现象、日志等等)
柜台雷同,例如多个CTP柜台,多个googlebuffer通道,多个zmq和rmq通道,还有多个定时器线程、wcf通道,看着栈基本雷同,很难区分。
我虽然用debugdiag打印了线程创建时的栈,但这也是创建的时候线程的栈,而不是创建者的栈,没法回溯到底谁创建的,位置在哪里创建的。
#11
知道谁启动的有什么意义?不让他启动?
缩小故障定位范围,工程有十几个项目,下面又带有多个柜台的程序,底层多个通信通道,对上层也有通信通道
每个项目都有自己的服务吧?能通过服务定位吗?(现象、日志等等)
日志就难了,创建线程一般都不打印线程号,有很多也是在别人的dll里面创建的,这个更没法把控了。
且很多线程属于守候线程,平时在哪里也不动,基本上都是在等待socket通信。
#12
知道谁启动的有什么意义?不让他启动?
缩小故障定位范围,工程有十几个项目,下面又带有多个柜台的程序,底层多个通信通道,对上层也有通信通道
每个项目都有自己的服务吧?能通过服务定位吗?(现象、日志等等)
日志就难了,创建线程一般都不打印线程号,有很多也是在别人的dll里面创建的,这个更没法把控了。
且很多线程属于守候线程,平时在哪里也不动,基本上都是在等待socket通信。
感觉是设计的问题,而不是技术的问题;设计导致了这种难以定位的结果;能先缩小范围吗?
#13
为什么不在创建新线程相关的那几个API上设断点观察呢?
为什么不在创建新线程相关的那几个API上设断点观察Call Stack中内容以确定属于哪个进程的哪个线程要创建当前线程呢?
#14
获取函数调用堆栈 仅供参考
#15
这个帖子结贴吧,实际上是上期所的CTP的dll内部内存泄露导致的崩溃,2016年4月份给上期所邮件,他们已经修改了代码发布新版本解决了这个问题。
20160613版本,没记错的话
去年一整年都在学习异常调试技术,基本解决了程序稳定性问题,不过由于大部分代码不是自己编写,且内部到底还存在哪些逻辑上的崩溃点还不能完全摸清楚。
实际上这个崩溃点是基本上天天崩溃,解决了这个问题后,我们的产品又陆续出现多次崩溃,不过在代码控制范围内基本都解决了。
由于已经非常熟悉崩溃调试,所以在代码控制范围内准确定位的,基本上2个小时之内就可以解决。但是对于栈被破坏的release版本,目前还是一头雾水,debug版本还有点疑问,过会另外开贴咨询。
20160613版本,没记错的话
去年一整年都在学习异常调试技术,基本解决了程序稳定性问题,不过由于大部分代码不是自己编写,且内部到底还存在哪些逻辑上的崩溃点还不能完全摸清楚。
实际上这个崩溃点是基本上天天崩溃,解决了这个问题后,我们的产品又陆续出现多次崩溃,不过在代码控制范围内基本都解决了。
由于已经非常熟悉崩溃调试,所以在代码控制范围内准确定位的,基本上2个小时之内就可以解决。但是对于栈被破坏的release版本,目前还是一头雾水,debug版本还有点疑问,过会另外开贴咨询。
#16
另外关于如何知道哪个模块启动了线程,PROCESS MONITOR可以看到线程启动的时候谁调用启动的,总体来说解决了我另外一个疑问