表达模板和C ++ 11(Expression templates and C++11)

template<typename T>
std::vector<T> operator+(const std::vector<T>& a, const std::vector<T>& b)
  std::vector<T> tmp;   // vector-sized temporary
  return tmp;

在C ++ 11这个函数的返回语句应用于移动语义。 矢量的任何副本。 这是一个双赢。


d = a + b + c;

我看到上面的函数被调用两次(两个operator+ ),而最终的分配可以通过移动语义来完成。

总共2个循环被执行。 意味着我摆了个临时的和读回右后。 对于大的载体中,这种脱落缓存。 这比表达式模板更糟。 他们可以做整个事情在短短的1环。 专家组可以执行上面的代码等同于:

for(int i=0 ; i < vec_length ; ++i)
  d[i] = a[i] + b[i] + c[i];

我想知道用移动语义或任何其他新的功能lambda表达式一起是否能够像外星人一样好。 有什么想法吗?


基本上,使用ET技术编译器生成解析树,与它的类型系统类似于代数表达式。 该树由内部节点和叶节点。 内部节点表示操作(加法,乘法等)和叶节点表示的数据对象的引用。

我试图想在堆栈机的时尚整个计算过程的:从操作叠搭的操作,并从参数堆栈拉下一参数和评估操作。 把结果返回堆栈等待操作上。

来表示这些两个不同的对象(操作堆栈和数据叶堆栈)我集束在一起std::tuple的操作和一个std::tuple的数据离开成std::pair<> 最初,我用了一个std:vector但导致运行时开销。

整个过程中去两个阶段:堆栈初始化机在操作和参数堆栈被初始化。 而评估阶段是由分配配对容器载体触发。


全球operator*超载为采取所有组合Vec和“表达”,使正确处理同样在我们的不仅仅是更多的情况下a*b 。 (请注意,我换了这个教育为例,乘法-基本上可以快速识别的imull在汇编。)

什么是评估前先进行启动的“提取”的价值观出了参与的Vec对象和初始化参数堆栈。 这是必要的不是有各种不同躺在附近的对象:可转位向量和非可转位结果。 这是什么样Extractor是。 尼斯的事情再次:可变参数模板用于其在没有运行时开销这种情况下的结果(这一切都是在编译时完成)。

整个事情的作品。 表达是很好的评价(I还添加了另外,而是留在这里,以适应代码)。 下面你可以看到汇编输出。 刚生compuation,完全按照你希望它是:EN-看齐ET技术。

结果。 的C ++ 11的新的语言特性提供可变参数模板,(与模板元编程一起)开辟编译时计算的面积。 我在这里表现出的可变参数模板的利益如何被用来生产代码与传统ET技术一样好。


template<typename Target,typename Tuple, int N, bool end>
struct Extractor {
  template < typename ... Args >
  static Target index(int i,const Tuple& t, Args && ... args)
    return Extractor<Target, Tuple,  N+1, 
             std::tuple_size<Tuple>::value == N+1>::
      index(i, t , std::forward<Args>(args)..., std::get<N>(t).vec[i] );

template < typename Target, typename Tuple, int N >
struct Extractor<Target,Tuple,N,true>
    template < typename ... Args >
    static Target index(int i,Tuple const& t, 
            Args && ... args) { 
      return Target(std::forward<Args>(args)...); }

template < typename ... Vs > 
std::tuple<typename std::remove_reference<Vs>::type::type_t...>
extract(int i , const std::tuple<Vs...>& tpl)
  return Extractor<std::tuple<typename std::remove_reference<Vs>::type::type_t...>,
           std::tuple<Vs...>, 0,
           std::tuple_size<std::tuple<Vs...> >::value == 0>::index(i,tpl);

struct Vec {
  std::array<int,5> vec;
  typedef int type_t;

  template<typename... OPs,typename... VALs>
  Vec& operator=(const std::pair< std::tuple<VALs...> , std::tuple<OPs...> >& e) {
    for( int i = 0 ; i < vec.size() ; ++i ) {
      vec[i] = eval( extract(i,e.first) , e.second );

template<int OpPos,int ValPos, bool end>
struct StackMachine {
  template<typename... OPs,typename... VALs>
  static void eval_pos( std::tuple<VALs...>& vals , const std::tuple<OPs...> & ops )
    std::get<ValPos+1>( vals ) =
      std::get<OpPos>(ops).apply( std::get<ValPos>( vals ) , 
                  std::get<ValPos+1>( vals ) );
    StackMachine<OpPos+1,ValPos+1,sizeof...(OPs) == OpPos+1>::eval_pos(vals,ops);

template<int OpPos,int ValPos>
struct StackMachine<OpPos,ValPos,true> {
  template<typename... OPs,typename... VALs>
  static void eval_pos( std::tuple<VALs...>& vals , 
            const std::tuple<OPs...> & ops )

template<typename... OPs,typename... VALs>
int eval( const std::tuple<VALs...>& vals , const std::tuple<OPs...> & ops )
  return std::get<sizeof...(OPs)>(vals);

struct OpMul {
  static int apply(const int& lhs,const int& rhs)  {
    return lhs*rhs;

std::pair< std::tuple< const Vec&, const Vec& > , std::tuple<OpMul> >
operator*(const Vec& lhs,const Vec& rhs)
  return std::make_pair( std::tuple< const Vec&, const Vec& >( lhs , rhs ) , 
             std::tuple<OpMul>( OpMul() ) );

template<typename... OPs,typename... VALs>
std::pair< std::tuple< const Vec&, VALs... > , std::tuple<OPs...,OpMul> >
operator*(const Vec& lhs,const std::pair< std::tuple< VALs... > , std::tuple<OPs...> >& rhs)
  return std::make_pair( std::tuple_cat( rhs.first , std::tuple< const Vec& >(lhs)  ) , 
             std::tuple_cat( rhs.second , std::tuple<OpMul>( OpMul() )  ) );

template<typename... OPs,typename... VALs>
std::pair< std::tuple< const Vec&, VALs... > , std::tuple<OPs...,OpMul> >
operator*(const std::pair< std::tuple< VALs... > , std::tuple<OPs...> >& lhs,
      const Vec& rhs)
  return std::make_pair( std::tuple_cat( lhs.first , std::tuple< const Vec& >(rhs)  ) , 
             std::tuple_cat( lhs.second , std::tuple<OpMul>( OpMul() ) ) );

int main()
  Vec d,c,b,a;

  for( int i = 0 ; i < d.vec.size() ; ++i ) {
    a.vec[i] = 10+i;
    b.vec[i] = 20+i;
    c.vec[i] = 30+i;
    d.vec[i] = 0;

  d = a * b * c * a;

  for( int i = 0 ; i < d.vec.size() ; ++i ) 
    std::cout << d.vec[i] << std::endl;

与生成的汇编g++-4.6 -O3 (我不得不把一些运行时的依赖到载体中初始化,这样编译器不计算整个事情在编译的时候,你实际看到imull instaructions。)

imull   %esi, %edx
imull   32(%rsp), %edx
imull   %edx, %esi
movl    68(%rsp), %edx
imull   %ecx, %edx
movl    %esi, (%rsp)
imull   36(%rsp), %edx
imull   %ecx, %edx
movl    104(%rsp), %ecx
movl    %edx, 4(%rsp)
movl    72(%rsp), %edx
imull   %ecx, %edx
imull   40(%rsp), %edx
imull   %ecx, %edx
movl    108(%rsp), %ecx
movl    %edx, 8(%rsp)
movl    76(%rsp), %edx
imull   %ecx, %edx
imull   44(%rsp), %edx
imull   %ecx, %edx
movl    112(%rsp), %ecx
movl    %edx, 12(%rsp)
movl    80(%rsp), %edx
imull   %ecx, %edx
imull   %eax, %edx
imull   %ecx, %edx
movl    %edx, 16(%rsp)

Answer 1:

我想知道用移动语义或任何其他新的功能lambda表达式一起是否能够像外星人一样好。 有什么想法吗?


移动语义不靠自己--techniques共万能作为这样的表达模板(ETS)仍然需要在C ++ 11,以消除开销如到处移动数据! 所以,前跳水快速解答您的问题到我的答案的其余部分,将语义等不完全替代专家组为我的回答如下所示。


专家组通常返回代理对象评估推迟到以后,所以的C ++ 11个语言特性没有直接的明显的好处,直到触发计算的代码。 这就是说,一个不想写ET代码,但是,与代理表达式树的构建过程中触发运行时代码生成。 奈斯利,C ++ 11的移动语义和完美转发可以帮助避免这样的开销应,否则会发生。 (这样就不会在C ++ 03是不可能的。)

从本质上讲,写外星人当一个人想要利用的方式的语言功能生成优化代码,一旦参与代理对象的成员函数(S)被调用。 在C ++ 11,这将包括使用完美转发,移动语义在复制等。如果这样实际上仍然需要之上什么编译器已经可以做到。 游戏的名称是最小化所产生的运行时代码和/或最大化运行时的速度和/或最小化的运行时间开销。

我想实际尝试一些专家组与C ++ 11功能,以看看是否能ALL的Elid中间临时实例类型与a = b + c + d; 表达。 (由于这是从我的正常的活动只是一个有趣的休息,所以我没有把它比作或用C ++写的03 ET纯粹的代码。我也没有担心,下面显示的代码抛光的方方面面。)

首先,--as我更愿意使用显式类型和functions--所以我不会为/相对于你的问题反驳lambda表达式我没有使用lambda表达式。 我的猜测是,他们将类似于使用仿函数和执行不低于低于非ET更好的代码(即移动将需要)--at至少直到编译器可以使用自己内部的专家组对这种自动优化lambda表达式。 我写的代码,但是,攻击移动语义和完美转发。 这是我没开始结果,最后呈现的代码。

我创建了一个math_vector<N>类其中N==3和它定义的内部私有实例std::array<long double, N> 成员是一个默认的构造,复制和移动的构造函数和任务,一个初始化列表构造器,析构函数,一个交换()成员,操作符[]进入矢量和操作员+ =的元件。 使用没有任何表情模板,这样的代码:

  cout << "CASE 1:\n";
  math_vector<3> a{1.0, 1.1, 1.2};
  math_vector<3> b{2.0, 2.1, 2.2};
  math_vector<3> c{3.0, 3.1, 3.2};
  math_vector<3> d{4.0, 4.1, 4.2};
  math_vector<3> result = a + b + c + d;
  cout << '[' << &result << "]: " << result << "\n";

输出(当编译clang++ 3.1或g++ 4.8与- std=c++11 -O3 ):

0x7fff8d6edf50: math_vector(initlist)
0x7fff8d6edef0: math_vector(initlist)
0x7fff8d6ede90: math_vector(initlist)
0x7fff8d6ede30: math_vector(initlist)
0x7fff8d6edd70: math_vector(copy: 0x7fff8d6edf50)
0x7fff8d6edda0: math_vector(move: 0x7fff8d6edd70)
0x7fff8d6eddd0: math_vector(move: 0x7fff8d6edda0)
0x7fff8d6edda0: ~math_vector()
0x7fff8d6edd70: ~math_vector()
[0x7fff8d6eddd0]: (10,10.4,10.8)
0x7fff8d6eddd0: ~math_vector()
0x7fff8d6ede30: ~math_vector()
0x7fff8d6ede90: ~math_vector()
0x7fff8d6edef0: ~math_vector()
0x7fff8d6edf50: ~math_vector()

即,使用初始化列表(即,四个明确的构造实例initlist项),则result变量(即, 0x7fff8d6eddd0 ),并且,也使得一个额外的三个对象复制和移动。


  cout << "CASE 2:\n";
  math_vector<3> result =
    math_vector<3>{1.0, 1.1, 1.2} +
    math_vector<3>{2.0, 2.1, 2.2} +
    math_vector<3>{3.0, 3.1, 3.2} +
    math_vector<3>{4.0, 4.1, 4.2}
  cout << '[' << &result << "]: " << result << "\n";


0x7fff8d6edcb0: math_vector(initlist)
0x7fff8d6edc50: math_vector(initlist)
0x7fff8d6edce0: math_vector(move: 0x7fff8d6edcb0)
0x7fff8d6edbf0: math_vector(initlist)
0x7fff8d6edd10: math_vector(move: 0x7fff8d6edce0)
0x7fff8d6edb90: math_vector(initlist)
0x7fff8d6edd40: math_vector(move: 0x7fff8d6edd10)
0x7fff8d6edb90: ~math_vector()
0x7fff8d6edd10: ~math_vector()
0x7fff8d6edbf0: ~math_vector()
0x7fff8d6edce0: ~math_vector()
0x7fff8d6edc50: ~math_vector()
0x7fff8d6edcb0: ~math_vector()
[0x7fff8d6edd40]: (10,10.4,10.8)
0x7fff8d6edd40: ~math_vector()


但是,我就想好了:我想零个额外的临时变量,并有代码,如果我用一个正常的编码警告硬编码的:所有的显式实例类型仍然会创建(即四个initlist构造函数和result )。 要做到这一点,我加入表情模板代码如下:

  1. 代理math_vector_expr<LeftExpr,BinaryOp,RightExpr>类被创建用于保存尚未计算的表达式,
  2. 代理plus_op类是为了保持加法运算,
  3. 加入一个构造函数math_vector接受math_vector_expr对象,并且,
  4. 加入“启动器”的成员函数来触发表达式模板的创建。

使用外星人的结果是美好的:在任何情况下,没有额外的临时! 前两例,现将输出上面:

0x7fffe7180c60: math_vector(initlist)
0x7fffe7180c90: math_vector(initlist)
0x7fffe7180cc0: math_vector(initlist)
0x7fffe7180cf0: math_vector(initlist)
0x7fffe7180d20: math_vector(expr: 0x7fffe7180d90)
[0x7fffe7180d20]: (10,10.4,10.8)
0x7fffe7180d20: ~math_vector()
0x7fffe7180cf0: ~math_vector()
0x7fffe7180cc0: ~math_vector()
0x7fffe7180c90: ~math_vector()
0x7fffe7180c60: ~math_vector()

0x7fffe7180dd0: math_vector(initlist)
0x7fffe7180e20: math_vector(initlist)
0x7fffe7180e70: math_vector(initlist)
0x7fffe7180eb0: math_vector(initlist)
0x7fffe7180d20: math_vector(expr: 0x7fffe7180dc0)
0x7fffe7180eb0: ~math_vector()
0x7fffe7180e70: ~math_vector()
0x7fffe7180e20: ~math_vector()
0x7fffe7180dd0: ~math_vector()
[0x7fffe7180d20]: (10,10.4,10.8)
0x7fffe7180d20: ~math_vector()

即,正好5构造函数调用,并在每种情况下5所析构函数调用。 事实上,如果你问的编译器来生成4之间的汇编代码initlist构造函数调用和的输出result一个得到这个美丽的汇编代码字符串:

fldt    128(%rsp)
leaq    128(%rsp), %rdi
leaq    80(%rsp), %rbp
fldt    176(%rsp)
faddp   %st, %st(1)
fldt    224(%rsp)
faddp   %st, %st(1)
fldt    272(%rsp)
faddp   %st, %st(1)
fstpt   80(%rsp)
fldt    144(%rsp)
fldt    192(%rsp)
faddp   %st, %st(1)
fldt    240(%rsp)
faddp   %st, %st(1)
fldt    288(%rsp)
faddp   %st, %st(1)
fstpt   96(%rsp)
fldt    160(%rsp)
fldt    208(%rsp)
faddp   %st, %st(1)
fldt    256(%rsp)
faddp   %st, %st(1)
fldt    304(%rsp)
faddp   %st, %st(1)
fstpt   112(%rsp)

g++clang++输出相似的(更小的)代码。 无功能调用等--just一堆增加这是一个想要什么!

在C ++ 11代码实现这一点如下。 只需#define DONT_USE_EXPR_TEMPL不使用外星人或不定义它在所有使用外星人。

#include <array>
#include <algorithm>
#include <initializer_list>
#include <type_traits>
#include <iostream>



template <std::size_t N> class math_vector;

template <
  typename LeftExpr,
  typename BinaryOp,
  typename RightExpr
class math_vector_expr
    math_vector_expr() = delete;

    math_vector_expr(LeftExpr l, RightExpr r) : 

    // Prohibit copying...
    math_vector_expr(math_vector_expr const&) = delete;
    math_vector_expr& operator =(math_vector_expr const&) = delete;

    // Allow moves...
    math_vector_expr(math_vector_expr&&) = default;
    math_vector_expr& operator =(math_vector_expr&&) = default;

    template <typename RE>
    auto operator +(RE&& re) const ->
        math_vector_expr<LeftExpr,BinaryOp,RightExpr> const&,
          math_vector_expr<LeftExpr,BinaryOp,RightExpr> const&,
        >(*this, std::forward<RE>(re))

    auto le() -> 
      typename std::add_lvalue_reference<LeftExpr>::type
      { return l_; }

    auto le() const ->
      typename std::add_lvalue_reference<
        typename std::add_const<LeftExpr>::type
      { return l_; }

    auto re() -> 
      typename std::add_lvalue_reference<RightExpr>::type
      { return r_; }

    auto re() const -> 
      typename std::add_lvalue_reference<
        typename std::add_const<RightExpr>::type
      { return r_; }

    auto operator [](std::size_t index) const ->
        BinaryOp::apply(this->le()[index], this->re()[index])
      return BinaryOp::apply(le()[index], re()[index]);

    LeftExpr l_;
    RightExpr r_;


template <typename T>
struct plus_op
  static T apply(T const& a, T const& b)
    return a + b;

  static T apply(T&& a, T const& b)
    a += b;
    return std::move(a);

  static T apply(T const& a, T&& b)
    b += a;
    return std::move(b);

  static T apply(T&& a, T&& b)
    a += b;
    return std::move(a);


template <std::size_t N>
class math_vector
  using impl_type = std::array<long double, N>;

      using namespace std;
      fill(begin(v_), end(v_), impl_type{});
      std::cout << this << ": math_vector()" << endl;

    math_vector(math_vector const& mv) noexcept
      using namespace std;
      copy(begin(mv.v_), end(mv.v_), begin(v_));
      std::cout << this << ": math_vector(copy: " << &mv << ")" << endl;

    math_vector(math_vector&& mv) noexcept
      using namespace std;
      move(begin(mv.v_), end(mv.v_), begin(v_));
      std::cout << this << ": math_vector(move: " << &mv << ")" << endl;

    math_vector(std::initializer_list<typename impl_type::value_type> l)
      using namespace std;
      copy(begin(l), end(l), begin(v_));
      std::cout << this << ": math_vector(initlist)" << endl;

    math_vector& operator =(math_vector const& mv) noexcept
      using namespace std;
      copy(begin(mv.v_), end(mv.v_), begin(v_));
      std::cout << this << ": math_vector op =(copy: " << &mv << ")" << endl;
      return *this;

    math_vector& operator =(math_vector&& mv) noexcept
      using namespace std;
      move(begin(mv.v_), end(mv.v_), begin(v_));
      std::cout << this << ": math_vector op =(move: " << &mv << ")" << endl;
      return *this;

      using namespace std;
      std::cout << this << ": ~math_vector()" << endl;

    void swap(math_vector& mv)
      using namespace std;
      for (std::size_t i = 0; i<N; ++i)
        swap(v_[i], mv[i]);

    auto operator [](std::size_t index) const
      -> typename impl_type::value_type const&
      return v_[index];

    auto operator [](std::size_t index)
      -> typename impl_type::value_type&
      return v_[index];

    math_vector& operator +=(math_vector const& b)
      for (std::size_t i = 0; i<N; ++i)
        v_[i] += b[i];
      return *this;


    template <typename LE, typename Op, typename RE>
    math_vector(math_vector_expr<LE,Op,RE>&& mve)
      for (std::size_t i = 0; i < N; ++i)
        v_[i] = mve[i];
      std::cout << this << ": math_vector(expr: " << &mve << ")" << std::endl;

    template <typename RightExpr>
    math_vector& operator =(RightExpr&& re)
      for (std::size_t i = 0; i<N; ++i)
        v_[i] = re[i];
      return *this;

    template <typename RightExpr>
    math_vector& operator +=(RightExpr&& re)
      for (std::size_t i = 0; i<N; ++i)
        v_[i] += re[i];
      return *this;

    template <typename RightExpr>
    auto operator +(RightExpr&& re) const ->
        math_vector const&, 
        plus_op<typename impl_type::value_type>,
          math_vector const&, 
          plus_op<typename impl_type::value_type>, 

  #endif // #ifndef DONT_USE_EXPR_TEMPL

    impl_type v_;


template <std::size_t N>
inline void swap(math_vector<N>& a, math_vector<N>& b)



template <std::size_t N>
inline math_vector<N> operator +(
  math_vector<N> const& a, 
  math_vector<N> const& b
  math_vector<N> retval(a);
  retval += b;
  return retval;

template <std::size_t N>
inline math_vector<N> operator +(
  math_vector<N>&& a, 
  math_vector<N> const& b
  a += b;
  return std::move(a);

template <std::size_t N>
inline math_vector<N> operator +(
  math_vector<N> const& a, 
  math_vector<N>&& b
  b += a;
  return std::move(b);

template <std::size_t N>
inline math_vector<N> operator +(
  math_vector<N>&& a, 
  math_vector<N>&& b
  a += std::move(b);
  return std::move(a);

#endif // #ifdef DONT_USE_EXPR_TEMPL


template <std::size_t N>
std::ostream& operator <<(std::ostream& os, math_vector<N> const& mv)
  os << '(';
  for (std::size_t i = 0; i < N; ++i)
    os << mv[i] << ((i+1 != N) ? ',' : ')');
  return os;


int main()
  using namespace std;

      cout << "CASE 1:\n";
      math_vector<3> a{1.0, 1.1, 1.2};
      math_vector<3> b{2.0, 2.1, 2.2};
      math_vector<3> c{3.0, 3.1, 3.2};
      math_vector<3> d{4.0, 4.1, 4.2};
      math_vector<3> result = a + b + c + d;
      cout << '[' << &result << "]: " << result << "\n";
    cout << endl;
      cout << "CASE 2:\n";
      math_vector<3> result =
        math_vector<3>{1.0, 1.1, 1.2} +
        math_vector<3>{2.0, 2.1, 2.2} +
        math_vector<3>{3.0, 3.1, 3.2} +
        math_vector<3>{4.0, 4.1, 4.2}
      cout << '[' << &result << "]: " << result << "\n";
  catch (...)
    return 1;


Answer 2:

这里是保罗Preney代码修正版本。 我已经通过电子邮件和意见告知作者; 我已经写了一个编辑,但它已被不合格的评审拒绝。

在原来代码中的错误是,math_vector_expr ::运算+的BinaryOp模板参数是固定的。

#include <array>
#include <algorithm>
#include <initializer_list>
#include <type_traits>
#include <iostream>



template <std::size_t N> class math_vector;
template <typename T> struct plus_op;

template <
  typename LeftExpr,
  typename BinaryOp,
  typename RightExpr
class math_vector_expr
    typedef typename std::remove_reference<LeftExpr>::type::value_type value_type;

    math_vector_expr() = delete;

    math_vector_expr(LeftExpr l, RightExpr r) :

    // Prohibit copying...
    math_vector_expr(math_vector_expr const&) = delete;
    math_vector_expr& operator =(math_vector_expr const&) = delete;

    // Allow moves...
    math_vector_expr(math_vector_expr&&) = default;
    math_vector_expr& operator =(math_vector_expr&&) = default;

    template <typename RE>
    auto operator +(RE&& re) const ->
        math_vector_expr<LeftExpr,BinaryOp,RightExpr> const&,
          math_vector_expr<LeftExpr,BinaryOp,RightExpr> const&,
        >(*this, std::forward<RE>(re))

    auto le() ->
      typename std::add_lvalue_reference<LeftExpr>::type
      { return l_; }

    auto le() const ->
      typename std::add_lvalue_reference<
        typename std::add_const<LeftExpr>::type
      { return l_; }

    auto re() ->
      typename std::add_lvalue_reference<RightExpr>::type
      { return r_; }

    auto re() const ->
      typename std::add_lvalue_reference<
        typename std::add_const<RightExpr>::type
      { return r_; }

    auto operator [](std::size_t index) const ->
      return BinaryOp::apply(le()[index], re()[index]);

    LeftExpr l_;
    RightExpr r_;


template <typename T>
struct plus_op
  static T apply(T const& a, T const& b)
    return a + b;

  static T apply(T&& a, T const& b)
    a += b;
    return std::move(a);

  static T apply(T const& a, T&& b)
    b += a;
    return std::move(b);

  static T apply(T&& a, T&& b)
    a += b;
    return std::move(a);


template <std::size_t N>
class math_vector
  using impl_type = std::array<long double, N>;

    typedef typename impl_type::value_type value_type;

      using namespace std;
      fill(begin(v_), end(v_), impl_type{});
      std::cout << this << ": math_vector()" << endl;

    math_vector(math_vector const& mv) noexcept
      using namespace std;
      copy(begin(mv.v_), end(mv.v_), begin(v_));
      std::cout << this << ": math_vector(copy: " << &mv << ")" << endl;

    math_vector(math_vector&& mv) noexcept
      using namespace std;
      move(begin(mv.v_), end(mv.v_), begin(v_));
      std::cout << this << ": math_vector(move: " << &mv << ")" << endl;

    math_vector(std::initializer_list<value_type> l)
      using namespace std;
      copy(begin(l), end(l), begin(v_));
      std::cout << this << ": math_vector(initlist)" << endl;

    math_vector& operator =(math_vector const& mv) noexcept
      using namespace std;
      copy(begin(mv.v_), end(mv.v_), begin(v_));
      std::cout << this << ": math_vector op =(copy: " << &mv << ")" << endl;
      return *this;

    math_vector& operator =(math_vector&& mv) noexcept
      using namespace std;
      move(begin(mv.v_), end(mv.v_), begin(v_));
      std::cout << this << ": math_vector op =(move: " << &mv << ")" << endl;
      return *this;

      using namespace std;
      std::cout << this << ": ~math_vector()" << endl;

    void swap(math_vector& mv)
      using namespace std;
      for (std::size_t i = 0; i<N; ++i)
        swap(v_[i], mv[i]);

    auto operator [](std::size_t index) const
      -> value_type const&
      return v_[index];

    auto operator [](std::size_t index)
      -> value_type&
      return v_[index];

    math_vector& operator +=(math_vector const& b)
      for (std::size_t i = 0; i<N; ++i)
        v_[i] += b[i];
      return *this;


    template <typename LE, typename Op, typename RE>
    math_vector(math_vector_expr<LE,Op,RE>&& mve)
      for (std::size_t i = 0; i < N; ++i)
        v_[i] = mve[i];
      std::cout << this << ": math_vector(expr: " << &mve << ")" << std::endl;

    template <typename RightExpr>
    math_vector& operator =(RightExpr&& re)
      for (std::size_t i = 0; i<N; ++i)
        v_[i] = re[i];
      return *this;

    template <typename RightExpr>
    math_vector& operator +=(RightExpr&& re)
      for (std::size_t i = 0; i<N; ++i)
        v_[i] += re[i];
      return *this;

    template <typename RightExpr>
    auto operator +(RightExpr&& re) const ->
        math_vector const&,
          math_vector const&,

  #endif // #ifndef DONT_USE_EXPR_TEMPL

    impl_type v_;


template <std::size_t N>
inline void swap(math_vector<N>& a, math_vector<N>& b)



template <std::size_t N>
inline math_vector<N> operator +(
  math_vector<N> const& a,
  math_vector<N> const& b
  math_vector<N> retval(a);
  retval += b;
  return retval;

template <std::size_t N>
inline math_vector<N> operator +(
  math_vector<N>&& a,
  math_vector<N> const& b
  a += b;
  return std::move(a);

template <std::size_t N>
inline math_vector<N> operator +(
  math_vector<N> const& a,
  math_vector<N>&& b
  b += a;
  return std::move(b);

template <std::size_t N>
inline math_vector<N> operator +(
  math_vector<N>&& a,
  math_vector<N>&& b
  a += std::move(b);
  return std::move(a);

#endif // #ifdef DONT_USE_EXPR_TEMPL


template <std::size_t N>
std::ostream& operator <<(std::ostream& os, math_vector<N> const& mv)
  os << '(';
  for (std::size_t i = 0; i < N; ++i)
    os << mv[i] << ((i+1 != N) ? ',' : ')');
  return os;


int main()
  using namespace std;

      cout << "CASE 1:\n";
      math_vector<3> a{1.0, 1.1, 1.2};
      math_vector<3> b{2.0, 2.1, 2.2};
      math_vector<3> c{3.0, 3.1, 3.2};
      math_vector<3> d{4.0, 4.1, 4.2};
      math_vector<3> result = a + b + c + d;
      cout << '[' << &result << "]: " << result << "\n";
    cout << endl;
      cout << "CASE 2:\n";
      math_vector<3> result =
        math_vector<3>{1.0, 1.1, 1.2} +
        math_vector<3>{2.0, 2.1, 2.2} +
        math_vector<3>{3.0, 3.1, 3.2} +
        math_vector<3>{4.0, 4.1, 4.2}
      cout << '[' << &result << "]: " << result << "\n";
  catch (...)
    return 1;


