Д. Стефенс - C++. Сборник рецептов Страница 40
Д. Стефенс - C++. Сборник рецептов читать онлайн бесплатно
Пример 4.3. Обобщенная версия rtrim
#include <string>
#include <iostream>
using namespace std;
// Общий подход к обрезке отдельных
// символов строки
template<typename T>
void rtrim(basic_string<T>& s, T с) {
if (s.empty()) return;
typename basic_string<T>::iterator p;
for (p = s.end(); p != s.begin() && *--p == c;);
if (*p != c) p++;
s.erase(p, s.end());
}
int main() {
string s = "Great!!!!";
wstring ws = L"Super!!!!";
rtrim(s, '!');
rtrim(ws, L'!');
cout << s << '\n';
wcout << ws << L'\n';
}
Эта функция работает точно так же, как и предыдущая, необобщенная версия из примера 4.2, но так как она параметризована по типу символов, она будет работать для basic_string любого типа.
Примеры 4.2 и 4.3 удаляют из строки последовательность одного символа. Однако обрезка пробелов выглядит по-другому, так как пробельный символ может быть представлен одним из нескольких символов. Для удобства стандартная библиотека предоставляет простейший способ справиться с этим: функцию isspace из заголовочного файла <cctype> (и ее wchar_t-эквивалент iswspace из <cwctype>). Пример 4.4 определяет общую функцию, которая обрезает концевые пробелы.
Пример 4.4. Удаление концевых пробелов
#include <string>
#include <iostream>
#include <cctype>
#include <cwctype>
using namespace std;
template<typename T, typename F>
void rtrimws(basic_string<T>& s, F f) {
if (s.empty()) return;
typename basic_string<T>::iterator p;
for (p = s.end(); p ! = s.begin() && f(*--p););
if (!f(*p))
p++;
s.erase(p, s.end());
}
// Перегрузка для облегчения вызовов в клиентском коде
void rtrimws(string& s) {
rtrimws(s, isspace);
}
void rtrimws(wstring& ws) {
rtrimws(ws, iswspace);
}
int main() {
string s = "zing ";
wstring ws = L"zong ";
rtrimws(s) rtrimws(ws);
cout << s << "|\n";
wcout << ws << L"|\n";
}
Шаблон функции rtrimws в примере 4 4 — это шаблон обобщённой функции, аналогичной предыдущим примерам, которая принимает basic_string и удаляет пробелы в ее конце. Но в отличие от других примеров, она для проверки элемента строки и определения того, должен ли он быть удален, принимает не символ, а объект функции.
Перегружать rtrimws, как это сделано в предыдущем примере, необязательно, но это упрощает синтаксис использования функции, так как вызывающий код при ее использовании может опустить аргумент логической функции.
Но, увы, это решение требует, чтобы вы писали код сами. Если же вы предпочитаете использовать библиотеку — и именно это и следует делать, — то библиотека Boost String Algorithms предоставляет огромное количество функций для обрезки строки, и в ней на верняка есть то, что вам надо. На самом деле, в библиотеке String Algorithms имеется огромное количество удобных функций обрезки, и при возможности использования Boost на них следует посмотреть. Таблица 4.1 приводит шаблоны функций этой библиотеки, используемые для обрезки строк, включая некоторые вспомогательные функции. Так как это шаблоны функций, они имеют параметры шаблонов, представляющие различные используемые типы. Вот что они означают.
Seq
Это тип, удовлетворяющий требованиям к последовательностям стандарта C++.
Coll
Это тип, удовлетворяющий менее строгим требованиям, чем стандартная последовательность. Для того чтобы узнать, каким требованиям удовлетворяет коллекция, обратитесь к определениям Boost String Algorithms.
Pred
Это объект функции или указатель на функцию, которая принимает один аргумент и возвращает логическое значение — другими словами, унарный предикат. В некоторые функции обрезки для обрезки элементов, удовлетворяющих некоторому критерию, можно передать собственный унарный предикат.
OutIt
Это тип, который удовлетворяет требованиям выходного итератора, как определено в стандарте С++. В частности, он должен поддерживать инкрементирование и присвоение нового положения для добавления элементов в конец последовательности, на которую он указывает.
Табл. 4.1. Шаблоны функций обрезки строк Boost
Объявление Описание template<typename Seq> void trim(Seq& s, const locale& loc = locale()); Обрезает пробелы с обоих концов строки, используя для классификации пробельных символов функцию классификации локали template<typename Seq, typename Pred> void trim_if(Seq& s, Pred p); Обрезает с обоих концов последовательности s элементы для которых p(*it) равно true, где it — это итератор, указывающий на элемент последовательности. Обрезка прекращается, когда p(*it) = false template<typename Seq> Seq trim_copy(const Seq& s, const locale& loc = locale()); Делает то же самое, что и trim, но вместо изменения s возвращает новую последовательность, содержащую обрезанные результаты template<typename Seq, typename Pred> Seq trim_copy_if(const Seq& s, Pred p); Делает то же самое, что и trim_if, но вместо изменения s возвращает новую последовательность, содержащую обрезанные результаты template<typename OutIt, typename Coll, typename Pred> OutIt trim_copy_if(OutIt out, const Coll& c, Pred p); Делает то же, что и предыдущая версия trim_copy_if, но с некоторыми отличиями. Во-первых, она дает гарантию строгой безопасности исключений. Во-вторых, она в качестве первого аргумента принимает выходной итератор и возвращает выходной итератор, указывающий на одну позицию после конца результирующей последовательности. Наконец, она принимает тип коллекции, а не последовательности. За дополнительной информацией обратитесь к списку перед этой таблицей trim_left trim_right Работает как trim, но только для левого или правого конца строки trim_left_if trim_right_if Работает как trim_if, но только для левого или правого конца строки trim_left_copy trim_right_copy Работает как trim_сору, но только для левого или правого конца строки trim_left_copy_if trim_right_copy_if Работает как trim_copy_if, но только для левого или правого конца строки. Обе функции имеют две версии — одна работает с последовательностью, а другая — с коллекциейПервые четыре шаблона функции, описанные в табл. 4.1, — это базовая функциональность функций обрезки библиотеки String Algorithms. Остальные являются вариациями на их тему. Чтобы увидеть некоторые из них в действии, посмотрите на пример 4.5. Он показывает некоторые преимущества от использования этих функций перед методами string.
Пример 4.5. Использование функций обрезки строк Boost
#include <iostream>
#include <string>
#include <boost/algorithm/string.hpp>
using namespace std;
using namespace boost;
int main() {
string s1 = " ведущие пробелы?";
trim_left(s1); // Обрезка оригинальной строки
string s2 = trim_left_copy(s1); // Обрезка, но оригинал остается без изменений
cout << "s1 = " << s1 << endl;
cout << "s2 = " << s2 << endl;
s1 = "YYYYboostXXX";
s2 = trim_copy_if(s1, is_any_of("XY")); // Используется предикат
trim_if(s1, is_any_of("XY"));
cout << "s1 = " << s1 << endl;
cout << "s2 = " << s2 << endl;
s1 = "1234 числа 9876";
s2 = trim_copy_if(s1, is_digit());
cout << "s1 = " << s1 << endl;
cout << "s2 = " << s2 << endl;
// Вложенные вызовы функций обрезки
s1 = " ****Обрезка!*** ";
s2 = trim_copy_if(trim_copy(s1), is_any_of("*"));
cout << "s1 = " << s1 << endl;
cout << "s2 = " << s2 << endl;
}
Пример 4.5 демонстрирует, как использовать функции обрезки строк Boost. Обычно способ их использования понятен из их названия, так что я не буду вдаваться в описания более подробные, чем даны в табл. 4.1. Единственная функция, имеющаяся в этом примере и отсутствующая в таблице, — это is_any_of. Это шаблон функции, который возвращает объект функции-предиката, используемый функциями серии trim_if. Она используется, когда требуется обрезать набор символов. Также есть аналогичная функция классификации, которая называется is_from_range и принимает два аргумента и возвращает унарный предикат, который возвращает истину, когда символ находится в заданном диапазоне. Например, чтобы обрезать в строке символы с а до d, требуется сделать что-то, похожее на следующее.
Жалоба
Напишите нам, и мы в срочном порядке примем меры.