Hsian Studio: 字串輸出入處理

字串輸出入處理

2008年9月8日星期一 by Anati

一個程式中字串處理是最重要的，往往因為字串處理的關係造成程式當掉，或是用指標取得的資料不是你所要的，又或是邊界條件的關係，讓你Debug搞了好久，只是錯在一點點小地方，後面我會加上自己修正stdio版本的函式，讓使用更方便。

※ scanf從鍵盤輸入中格式讀取資料

我想scanf()應該大家最常用到的輸入資料的函數了，所以這邊就不多講了，但是它卻具有很特別的妙用，scanf是格式化輸入，所以可以你訂出來的格式，別人套用你的格式來輸入資料。

scanf中空格的意義

使用%s%d%f等等的格式輸入，在讀到目標之前有遇到空白或是TAB或是換行字元，都會自動略過，直遇到整數或是字串或是浮點數，但是如果是用%c的話，那是讀取stdin中第一個字元，那如果是空白列，那可就讀到空白了，因此可改成scanf(" %c")表示要讀取一個字元之前，自動略過前面有空白或是TAB或是換行的字元。

scanf中的略過「*」和集合「[]」

* %*s (跳過讀入一個字串)
* %*d (跳過讀入一個數值)
* %[] (讀取字串，但只讀取包含於集合中的字元)
* %[^] (讀取字串，直讀到包含於集合中出現的字元)
* []的正規表示式，可用「-」來表示從那裡到那裡
* %[a-z]讀取字串中的字元只含a-z的字元，若讀到別的字元或是數字就停止
* %[^0-3]讀取一字串，直讀到遇到0123字元的出現就停止讀取。
* 程式回傳讀入成功的數目

Example:
輸入2007/6/6要取得年月日的話

if (scanf("%d%*[ \n\t/]%d%*[ \n\t/]%d", &a, &b, &c) == 3)
{
printf("year: %d, month: %d, day %d", a, b, c);
}

or

scanf("%d %*c%d %*c%d", &a, &b, &c);

其中%*[ \n\t/]指跳過「空白」「Tab」「換行」「/」這些字元，或是利用scanf中的空白字元，讓讀入自動會跳過空白或TAB或是換行。

由上程式我們可以由自訂的格式輸入來把year, month, day全都讀入，而別人如果沒有造你的格式輸入的話，資料回傳就不會剛剛好等於3，那就是代表資料輸入有錯誤。

Example:
輸入(13, 22, 41)要把數字取出來的話

scanf("%*[ \t\n(]%d%*[ \t\n,]%d%*[ \t\n,]%d%*[ \t\n)]", &a, &b, &c);

仔細的分解一下，就漸漸可以了解這種格式輸入要怎麼活用，如果可以活用的話，那取資料的時候就可以大大減少自己在那邊拆來拆去，拿出自己要的東西了。

※ fgets從鍵盤一次讀入一行

本來應該使用gets的，但是因為gets沒有長度限制，所以你的string buffer要是不夠大的話，輸入只要超過你的buffer那資料就會覆寫到別得資料空間，所以說是非常可怕的，因此使用fgets，可以限定輸入的資料不可以超過你的buffer大小，fgets還有些要注意的。

* 只會讀到n-1個字元，或是讀到'\n'(換行字元)就停了
* 輸入超過buffer大小時，結尾不含'\n'
* 輸入不到buffer大小時，結尾自動會補上'\n'

Example:
修正fgets讓不管是輸入超過或是輸入不到，都不會有換行字元

char* fix_gets(char* buf, int num, FILE* fp)
{
char* find = 0;
fgets(buf, num, fp);
if (find = strrchr(buf, '\n'))
{
*find = '\0';
}
else
{
while (fgetc(fp) != '\n');
}
return buf;
}

如此我從fix_gets讀入到buffer中的資料不會再有的時候有'\n'，又有的時候沒有'\n'的問題了，而且也不用管它怎麼做，只要把 buffer的大小告訴它，就自動幫我做的好好的了。而當stream中資料實在太多超過buf的時候，會自動把buf不要取得的資料刪掉。

Example:
呼叫使用修正過的fix_gets函數

char buffer[21];
fix_gets(buffer, 21, stdin);

※ sscanf從陣列中格式化讀取資料

和scanf並沒有兩樣，只是讀取資料是從陣列中取出而已，通常用在我們有一些固定格式的資料，放在這個陣列裡面，而我們要抽離出裡面某些值的時候，可以使用sscanf，而它也具有scanf格式化的特性，如此就不用自己寫一堆判斷式了。

Example:
從buffer格式化讀出需要的資料

char str[] = "2007/3/25";
if (sscanf(str, "%d%*c%d%*c%d", &a, &b, &c) == 3)
{
printf("%d %d %d\n", a, b, c);
}

※ printf格式化資料輸出

我想printf應該是寫C第一個用到的函式吧！除了該有的格式以外，它格式化輸出，有兩種修飾字「旗標」和「數字」還有「.數字」，以下就來解釋一下這幾個東西分別的意義。

旗標

* - 靠左對齊 ex: %-20s
* + 若是正數就加正號，負數就加負號 ex: %+6.2f
* # 輸出8或16進位時，會加上0(八進制)或是0x(十六進制) ex: %#x
* 0 實際數值前的位置全部放0，而非空白字元 ex: %010d

數字

* 設定最少使用長度，如果顯示的數字或是字串超過的話，會使用更多的位數 ex: %4d

. 數字

* 對%f, %e，它代表小數點右邊有幾個數字 ex: %.2f (小數點後2位)
* 對%s，它代表最多的輸出字元數 ex: %.5s (只輸出字串前5個字)
* 對%d，它代表最少要出現幾個數字，不夠的自動補0 ex: %.10d (輸出數字不滿10位，則前面自動補0)

Example:
各種printf的格式化輸出

printf("%10d", 123); output: _______123
printf("%-10d", 123); output: 123_______
printf("%10.3f", 3345.67); output: __3345.670
printf("%010.2f", 3345.67); output: 0003345.67
printf("%5.3d", 8); output: __008
printf("%10.5s", "hello world"); output: _____hello
printf("%-10.5s", "hello world"); output: hello_____

※ puts將字串輸出且自動加上換行符號

使用puts(data);相同於使用printf("%s\n", data);但是使用puts比較簡短方便，而且會自動加上換行字元，真的是非常的棒，所以單一要輸出一個字串不混合輸出的時候，使用puts比較方便。

※ sprintf格式化的把資料寫入buffer中

sprintf是非常好用的函式，最常拿來使用型別轉換了，因為要把數字或是浮點數轉換成字串，在標準函式庫裡面是沒有的，因此使用sprintf最好用了，只要指一下格式，就可以把資料寫到我們的buffer中了。

Example:
將100數值轉成字串

char* itoa(char* to, int from, int num)
{
char tmp[11]; (int最大數表示為2147483648剛好10位要加上'\0')
sprintf(tmp, "%d", from);
fix_strcpy(to, tmp, size); (修正過指定大小的strcpy下面會說)
return to;
}

※ strcmp比較兩字串是否相同

比較兩字串是否相同，如果相同的話回傳0，不同的話可能是正值也可能是負值，不過最常使用的就是看有沒有回傳0了，因此程式可以寫成這樣。

Example:
比較兩字串是否相等

const char* str1 = "hello world";
const char* str2 = "helloworld";
if (!strcmp(str1, str2))
{
do something...
}

※ strncpy複製字串到buffer中

本來應該使用strcpy的但是因為strcpy沒有限字元數，因此如果buffer不夠大的話，複製過去多的字元可能會覆寫到其它的記憶體，造成程式當掉，因此轉而使用strncpy比較安全。

* 會複製n個字元，或是讀到'\0'(空字元)為止
* 複製來源少於目標時，連'\0'都會複製
* 複製來源多於目標時，'\0'要自行加上去

Example:
修正strncpy讓複製n-1字元過去，而且都會自動加上'\0'

char* fix_strcpy(char* to, const char* from, int num)
{
int size = num-1;
strncpy(to, from, size);
if (strlen(from) >= size)
{
to[size] = '\0';
}
return to;
}

如此我們在使用上，就不用管它怎麼做的了，只需要將我們的buffer的大小直接傳給它，就會自動幫我做的好好的了。

Example:
使用修正版的strcpy對字串做複製

char buffer[11];
const char* str = "hello world!!";
fix_strcpy(buffer, str, 11);

※ strlen計算一字串的元字數

strlen計算字元數可以用於指標或是陣列，只要它最後面有'\0'空字元者都可以使用，而回傳的是不含空字元的數量。

Posted in: C_C++ | | |

1 意見:

On 2014年10月24日凌晨2:54 匿名提到...

請問在fix_fgets的範例中,

char* find = 0;

這樣的寫法是正確的嗎?

執行上沒有問題.

張貼留言

訂閱：張貼留言 (Atom)

Hsian Studio

字串輸出入處理

1 意見:

Categories

Blog Archive

Linker

Viewer